扫二维码与项目经理沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
报表的数据源可以是由ODBC管理的DSN数据源,与数据库或其中一个表、文本文件、电子表格等关联。
员工经过长期磨合与沉淀,具备了协作精神,得以通过团队的力量开发出优质的产品。创新互联公司坚持“专注、创新、易用”的产品理念,因为“专注所以专业、创新互联网站所以易用所以简单”。公司专注于为企业提供成都网站设计、网站建设、外贸网站建设、微信公众号开发、电商网站开发,小程序设计,软件按需策划设计等一站式互联网企业服务。不学网络爬虫,用Excel抓取数据,可以吗?当然可以,但使用起来不是很灵活。没有像Python这样的语言来捕获数据以便于处理。下面我介绍一下用Excel采集数据的过程,实验环境win7office2013,主要内容如下:
1。创建一个新的EXCEL文件,双击打开该文件,然后选择“数据”->“来自网络”,如下所示:
2。在弹出子窗口中输入要抓取的页面,在此处抓取http://www.pm25.in/rank以页面数据为例,分别点击“go”—>“import”,如下所示:
3。导入成功后,数据如下:如果要定期刷新数据,可以点击“全部刷新”->“连接属性”自定义刷新频率。默认值为60分钟:
在弹出的“选择属性”窗口中,设计刷新频率并定期刷新数据:
到目前为止,我们已经完成使用Excel抓取数据。一般来说,整个过程很简单,但是灵活性不是很高,如果页面比较复杂,捕获的数据量也比较多,后期直接在Excel中处理也不是很方便,问题的主人已经懂python了,所以建议用python直接捕获,这是很好的更灵活。Python提供了很多爬虫包和框架,比如requests、BS4、lxml、scrapy等,可以快速抓取数据,也方便后期处理(比如panda、numpy等),学习一下吧,你可以很快开始,网上有相关的资料和教程,希望上面的分享内容能对你有所帮助。
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流