怎么是你的博客

关注互联网,关注搜索,关注信息技术对现代生活方方面面的影响

越来越强大的采集利器-火车头采集器

        大约是2006年的时候我第一次接触了火车头采集器,当时就已经发现这是一个采集功能非常强的采集软件。特别是当你需要更新数量较多的网站时,你可以利用它方便的控制所有网站的内容更新。但由于各种原因该软件并不十分完善,主要体现在容易出现各种错误,导致采集任务不稳定。当我前两天再次使用火车头时,才发现该软件已经又发展了许多版本,而且目前已经走上了团队开发商业化的道路,官网及论坛也比原来更人性化了。火车采集器V2008是其最新的版本,它已发展成了一个供各大主流文章系统,论坛系统等使用的多线程内容采集发布程序。使用火车采集器,你可以瞬间建立一个拥有庞大内容的网站。系统支持远程图片下载,图片批量水印,Flash下载,下载文件地址探测,自制作发表的cms模块参数,自定义发表的内容等。此外,丰富的规则制定,内容替换功能,对Access,Mysql,MSsql的数据入库导出的支持。据说现在用火车头采集的论坛数据经导出后可以与原论坛完全一样,以至于许多人不能单凭外表看出该论坛是否为采集生成的。可见,现在的火车采集器功能之强大。
...

百度和Google的博客搜索

        今天从本博的统计中发算有几个IP是使用百度的博客搜索过来的,以前一直没有关注过这种类型的搜索,今天才知道原来百度和Google都有一个专门的博客搜索分类,就好像图片搜索一样这是一个专门为搜索互联网中博客的文章的。在尝试了两个引擎的博客搜索后,感觉有有点失望。因为无论百度还是Google这方面收录的内容都不多,比如搜索“智能手机”一词,百度博客搜索有17,200条记录,Google博客搜索有14,625条记录,与网页搜索间记录数相差至少两上数量级。而实际上使用网页搜索就可以搜出很多博客里的文章,所以我觉得现在阶段博客搜索单独存在的价值并不高。也许国外很多人会使用这个分类搜索吧,总之中文博客信息量并不算多。

...

UTF-8与GB2312这两种字符集的区别

        今天学习DEDE模板制作时,下载的一套模板显示时出现了乱码,后经检查发现是字符集问题。于是在网上搜索了一下相关的信息,了解到了utf-8与gb2312的一些区别:       
        GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。
...

分页:«123»

最近引用

Search

Powered By Z-Blog 1.8 Walle Build 100427 Designed by Han'space

Copyright xxxx-xxxx Your WebSite. Some Rights Reserved.