dedecms 采集技巧之指定文章来源 -足球即时指数
优采云采集器 发布时间: 2020-08-11 04:08许多同学在采集的时侯会碰到这样的问题,一些网站上的文章来源里会出现两个甚至多个来源媒体,这样就太不容易写文章来源的匹配规则,而且许多来源都是有链接的,这样又降低了写匹配规则的难度,在这些情况下,我们太有必要为所有的采集文章指定一个固定的文章来源
具体方式如下:
在采集规则写好后,点击“更改配置”,在数组配置可以找到这段代码:
{dede:item field='source' value='' isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:function}{/dede:function}
{/dede:item}
在这里我们可以给source的value附一个值,比如"织梦峰会",修改后的代码如下:
{dede:item field='source' value='织梦峰会' isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:function}{/dede:function}
{/dede:item}
这样更改,就可以将所有采集到的文章的来源固定为“织梦峰会”了。
但是有些同事还有些特殊的要求,需要为这个来源添加一个链接,还是很简单的,只需把value的值改成
织梦峰会
但是在默认的情况下,文章内容页中的文章来源是不会显示的,因为数据库中对source的宽度做了限制,只要步入数据库中找到表dede_archives 修改source的宽度就可以了
采集数据导出完成后,找到采集-批量维护-自动摘要/分页,然后[开始执行]就可以手动采集文章摘要了,最后更新一下html就ok 了
优采云采集器是一个根据用户提供的关键词,云端自动采集相关文章并发布到用户网站的网站采集器。它能够自动识别各种网页上的标题、正文等信息,不需要用户编写任何采集规则就可以实现全网采集。采集到内容后,会自动计算内容与所设定的关键词的相关度,只把相关的文章推送给用户。支持标题前缀、关键词自动加粗、插入固定链接、自动提取tag标签、自动内链、自动配图、自动伪原创、内容过滤和替换、电话号码和网址清理、定时采集、百度主动提交等一系列seo功能。用户只需设置好关键词和相关需求,就能实现全托管、零维护的网站内容更新。不限网站数量,不管是单个网站还是大批量站群,都可以非常方便的进行管理。