大家好,欢迎来到IT知识分享网。
获取数据的方式有很多,如公开的数据集、爬虫、数据采集工具、付费API等。下面解药介绍几个常用的数据网站和获取数据的几种方式。
1、公开的数据集
UCI
经典的机器学习、数据挖掘数据集,包含分类、聚类、回归问题下的多个数据集。
国家数据
国家统计局,包含了我国经济民生等多方面的数据。
CEIC
最完整的一套超过128个国家的经济数据,能精确查找GDP、CPI、进口、出口、外资直接投资、零售、销售以及国际利率等深度数据。
万得
在金融业有着全面的数据覆盖。数据类目更新很快。
搜数网
中国咨询行自1992年以来收集的所有统计和调查数据。
中国统计信息网
国家统计局官网网站,汇集了海量的全国各省级政府各年度的国民经济和社会发展的统计信息等。
亚马逊
来自亚马逊跨学科的云数据平台,包含化学、生物、经济等多个领域的数据集。
Figshare
研究成果的共享平台,可以找到世界各地牛人们的研究成果数据。
Github
包含各个细分领域的数据库资源,自然科学和社会科学的覆盖都较全面,适合做研究和数据分析的人员。
政府开放数据
数据竞赛网站
2.利用爬虫获取数据
通过爬虫技术爬取网站上的数据。
3.数据交易平台
属于付费平台,如优易数据、数据堂等
4.网络指数
通过指数的变化可以查看某个主题在各个时间段受关注的情况,进行趋势分析、行情分析和预测。如百度指数、阿里指数、友盟指数、爱奇艺指数等。
5.网络采集器
通过软件的形式实现简单快捷的采集网络上分散的内容,如造数、爬山虎等。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/132373.html