扫二维码与项目经理沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
虽说我没写过,但作为看过一些基础知识的开发者还是可以给你一些提议的
成都创新互联公司坚持“要么做到,要么别承诺”的工作理念,服务领域包括:成都网站制作、网站设计、企业官网、英文网站、手机端网站、网站推广等服务,满足客户于互联网时代的蚌埠网站设计、移动媒体设计的需求,帮助企业找到有效的互联网解决方案。努力成为您成熟可靠的网络建设合作伙伴!
首先就是数据源,也就是采集的目标,你必须十分清楚目标源URL的规律并总结出对应的算法,这样每次开奖后只需要从用算法算出来的URL取数据,再利用后面的步骤挖掘数据基本上就可以了
其次是数据挖掘,说人话就是找金子,从数据源URL中把整个网页的代码都down下来(其实这才是我们需要的数据源),然后你必须十分了解该网页的结构规律,再根据规律用算法将关键的部分筛选出来,根据源网站的规则将这些关键数据排在一起
当然你要考虑的问题还有一个,那就是在什么时间去采集数据,对于返回回来的各种数据要如何应对。光这一点就很伤脑筋了,因为你有可能down下来的是404页面,有可能是503、504等错误页面,要考虑的问题还是很多的。我是不懂什么双色球了,就数据采集和数据挖掘这块凭我那还没生锈的脑子希望能给你一些帮助吧
?php
mysql_connect("localhost","root","123456") //填写mysql用户名和密码
or die("Could not connect to MySQL server!");
mysql_select_db("phpcms") //数据库名
or die("Could not select database!");
mysql_query('set names "gbk"'); //数据库内数据的编码
?
?php
header("Content-type: text/html; charset=utf-8");
$url="";
$a=file_get_contents($url);
$pos1=strpos($a,'开奖公告/a');
$pos2=strpos($a,'tr class="hot1"');
$chang=$pos2-$pos1;
$s=substr($a,$pos1,$chang);
unset($a);
$s=htmlspecialchars($s);
$s=str_replace("\r\n","",$s);
echo $s;
?
我只能帮你写到这里,不知道为什么strip_tags函数没法用。
另外,你可以装xampp很容易用的。
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流