添加节点:
目前成都创新互联已为千余家的企业提供了网站建设、域名、雅安服务器托管、网站托管维护、企业网站设计、昌吉网站维护等服务,公司将坚持客户导向、应用为本的策略,正道将秉承"和谐、参与、激情"的文化,与客户和合作伙伴齐心协力一起成长,共同发展。
选择要增加采集的栏目:
进入增加节点表单:
在节点名称框里起个名字,然后把要采集的新浪各地新闻列表地址copy过来:
下来发现好多选项,如“采集页面地址方式二,内容页地址前缀...”先不要理他,后面再一一详解,直接拉到 “信息链接区域正则”这里:
6
这里是设置采集的列表信息链接区域正则,我们点击查看新浪各地新闻列表“源文件”:
7
把源文件代码copy到Dreamweaver里,在Dreamweaver里选定要采集的信息链接区域:
你采集的区域有问题, 哪里没有带连接的! 所以导致后面没有连接
写个JAVA里的实现
String url= Jiang/546705102108.html;
String newurl=url.replaceAll(" ","20%"); 这行就是把url里所有的空格换成20%
return newurl;
帝国CMS7.0采用了更强劲的架构,性能提升30%; 支持无限附件分表,管理与选择附件速度更快; 支持无限评论主表分表,容量更大,效率更高; 专题大更新,功能更强大,制作专题更方便; 新增采集规则导出与导入功能,支持所有系统模型