扫二维码与项目经理沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
*参数说明:
我们提供的服务有:成都做网站、成都网站设计、微信公众号开发、网站优化、网站认证、武汉ssl等。为近1000家企事业单位解决了网站和推广的问题。提供周到的售前咨询和贴心的售后服务,是有科学管理、有技术的武汉网站制作公司
* LabelUrl - 当前采集的页面的Url地址
*$LabelCookie - 当前采集页面,服务器返回的Cookie信息。
根据以上参数可以推断,我们需要在$LabelArray['Html'] 中对原标签进行处理
例如(替换):
插件中:
if( LabelArray['PageType']=="Content")
{
LabelArray['Html']);
}
else if( JsonData[initDataObj][goods][skus] as specs = normalPrice = groupPrice = skuId = shuxing = "";
foreach ( spec) {
spec[spec_key].'/spanspan:'. shuxing = spe;
}
shuxing.'/spanspan单价:'. sku[groupPrice].'/spanspanskuId:'. LabelArray['Html']='test'. LabelArray['Html'];
}
遇到的坑:
测试时在else if( LabelArray['PageType']=="List")中处理
一个插件文件需要在对应的配置中选择才会执行,例如插件有请求处理,结果处理,但是火车头配置中至选了结果处理插件,则请求的部分不会执行
字段说明:(标有*的为必填字段,绿色值为默认值)
*log_CateID:文章的分类ID
*log_Title:文章标题
*log_Content:文章内容
log_Tag:文章标签ID,格式为{标签ID},多个为{1}{2}{3}
log_Status:文章的状态,0为正常发布,1为草稿,2为审核
log_Type:文章的类别,0为文章,1为页面
log_IsTop:文章是否置顶,0是不置顶,1是置顶
log_Intro:文章摘要,默认是50字符
log_PostTime:文章发布时间,为UNIX时间戳,默认当前时间
log_ViewNums:文章浏览数,默认为0次
发表地址后缀:zb_users/plugin/QeeZer_Locoy/LocoyPost.php?locoy_key=火车头自动发布密令
火车头采集器(V8.6为例)设置部分:
主要就是发布地址、post字段设置等,
1、我们先新建两个标签,里面起始结束代码不用填任何东西,只用于插件后面对其进行赋值操作,保存数据。
这两个标签名分别是:首图,是否图片新闻
2、复制PHP-demo.php文件,修改为 PHP-zhangthree01.php
以下为获取第一张首图和判断是否图片新闻的主要代码,php文件见附件
function bodyfirstimg($body) {
$body = strtolower($body);
if ( preg_match("/img.*src=[\"](.*?)[\"].*?/", $body, $regs))
{ //使用正则获取第一幅图像地址
return $regs[1] ;
}
else
{
return '' ;
}
}
if($LabelArray['Html'])
{
$LabelArray['Html']='当前页面的网址为:'.$LabelUrl."\r\n页面类型为:".$LabelArray['PageType']."\r\nCookies数据为:$LabelCookie\r\n接收到的数据是:".$LabelArray['Html'];
}
else
{
$LabelArray['首图'] = bodyfirstimg($LabelArray['内容']);
$LabelArray['是否图片新闻'] = $LabelArray['首图']==''?false:true;
}
该附件下载后解压为PHP-zhangthree01.php放到程序下Plugins目录
3、在插件配置那 考虑到采内容后还可能下载图片,所以选择在保存时选择此插件使用即可
4、以新浪新闻规则作为测试。
伪原创插件api目前用过就小发猫AI+的靠谱,一个基于人工智能的伪原创软件,生成的内容原创度比较高,而且有使用教程
1、修改火车头的PHP环境
由于火车头采集器软件内置的PHP环境有问题,在使用PHP插件之前需要先修改火车头的PHP环境。修改的方法很简单,打开火车头网站采集软件的安装目录“System/PHP”,找到php.ini文件打开,并找到如下代码。
找到 php_curl.dll 把前面的分号去掉改成:
修改前:
;extension=php_curl.dll
修改后:
extension=php_curl.dll
也就是将最前面的分号“;”删除并保存即可,这样火车头数据采集器就可以正常运行这个PHP仿写插件了。
2、插件要统一放到火车头插件目录
例如我本机是:D:\火车采集器V9\Plugins
问:这个插件主要功能是什么?
回答:火车头是一个采集器。采集后,如果开了插件,会把采集到的内容通过插件处理后再保存,我们的插件是伪原创,所以采集的内容会伪原创后保存。
3、调试方法
首先按原来的方式,先确保采集规则能正常运行。
然后,在正常运行的基础上,选择伪原创插件。
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流