偶做了一个新闻采集的小程序,可以导出RSS文件,配合SA的导入功能,可以一下子导入采集的新闻,目前已经做好163滚动新闻,国际新闻,国内新闻,娱乐新闻,crsky软件,Cnbeta新闻进行自动采集。今天首次发布163滚动新闻采集器。
本软件为绿色免费软件,解压后即可以使用!版权所有,盗版不究!
开发平台:
Delphi7 + WindowsXP SP2
测试平台:
WindowsXP SP2 / Windows2000 Server / Windows 2003
(其它平台未测试,只要是Windows系统应该都兼容的)
功能简介:
自动采集新闻标题,网站URL地址,新闻详细内容,新闻description部分自动过滤HTML代码,自动采集完整的新闻详细内容。
定时采集,自动过滤重复的新闻,导出RSS XML文件,
日志管理,数据支持ACC数据库和MSSQL数据库(也可以用于其它网站的导入功能)
使用说明:
点击采集新闻,软件是单线程进行采集(不会用多线程,呵呵,不要丢砖谢谢),等待采集完成以后,导出文件即可,输出的文件是XML文件,可直接导入到Sablog博客中,(注意:如果你的博客是UTF-8编码格式的话,请用转换工具如EditPlus打开导出的XML文件,另存为UTF-8格式即可),另外当新闻导出后,数据库会自动记录新闻为“已导出”状态,如果点“全部初始化”,会将数据库中所有已经采集的新闻置为“未导出”状态,可以再次导出所有新闻。
为配合Sablog导入,偶简单修改过Admin\database.php 请大家下载后,先备份原文件,再覆盖database.php 文件即可。
如果是导入到其它系统的话,请使用data\data.mdb文件导入即可,net163_news 为新闻表,net163_log 为日志表
20 条评论
猫·你真厉害~~会用了!
希望作者可以放出更多的相关频道/内容的采集器,我愿给您做上链接,谢谢。
你加我的邮箱地址就可以!
QQ2007正式版,我已经绑定了邮箱登录. gmail的邮箱,首页最上面有哈.
嘿嘿~我还是琢磨出来了~
1.采集
2.导出
3.用EditPlus另存位ut8格式,,选择 文件-另存为就有一个选择 保存 UT8
还有附件: database.rar (6.52 K, 下载次数:20)
要下载,然后解压上传至/admin/覆盖就OK
然后导入RSS就OK了··
PS找到问题了!!就是没有覆盖database这个文件,和没有转换UT8才不行的··希望对小菜有帮助!
对了~~猫哥QQ多少哇
[quote=失落]偶菜鸟,还在琢磨怎么用呢,,希望猫猫大大能简单说下过程··嘿嘿 工具很不错··很喜欢··就是不大会= =~[/quote]
谢谢你支持,你先采集新闻,完成以后导出XML文件,导入到网站内容就可以了啊.
偶菜鸟,还在琢磨怎么用呢,,希望猫猫大大能简单说下过程··嘿嘿
工具很不错··很喜欢··就是不大会= =~
[quote=失落]嘿嘿~好东西~~我支持下你哦~[/quote]
谢谢了.
嘿嘿~好东西~~我支持下你哦~
你还不如把sk的采集器和sablog合并呢,支持的人会更多
[quote=goodman]采集正常了,但怎么导入都是X码的?已经打开XML文件存为utf8也不行,存为gb2312也时乱码。[/quote]
如果你的网站编码是gb2312的话,直接导入就可以了.
如果是utf8,打开xml另存为utf8编码就可以了.