大家好,欢迎来到IT知识分享网。
前言
Kaggle是全球最大的数据科学平台。其中比赛含金量很高。笔者与小伙伴们刚开始进行Kaggle,遇到了一些问题,于是写出这篇文章,以帮助读者避免我们遇到过的问题。
一、Kaggle的注册
要开始Kaggle竞赛,首先需要有一个Kaggle账号,Kaggle平台的链接在右边蓝色字体。 Kaggle平台。
打开后的界面如下:
这里提供了Register with Google和Register with Email两个选项,任选一个进行注册就OK了。
二、Join第一个Kaggle比赛
在右边能看到你在Kaggle的活跃天数,贡献的数据集、参与的讨论、参加的比赛和课程。后面多用就明白具体是什么意思了。
在左边单机”Competitions”就能找到比赛。选择你想要的比赛并打开。新手建议找到Getting Started的Titanic号开始。
类似于这个界面,单机右上角就能加入比赛了。另外,官方也有详细的文档来介绍Kaggle比赛以及如何提交,本文只是更详尽一些以及强调一下之前笔者犯过的错误,让后来者少踩坑。点击右方蓝色字体快速跳转。 官方文档。
三、Kaggle数据的下载与结果的提交
官方同样有详细的文档教程如何提交,点击右方蓝色字体快速跳转。 提交教程。
刚入门Kaggle或者一些对Kaggle完全不了解的朋友可能不太了解Kaggle提交具体是要提交什么。这里大概说明一下,Kaggle的提交只需要提交一个包含预测结果的数据文件即可,并不需要提交代码,更不需要像数学建模一样提交论文。它的评分机制是根据你提交的结果,和它的真实结果,计算准确率、F1分数等衡量预测结果好坏的指标,然后给出相应的评分。部分比赛会有较为详细的说明。接下来将以Titanic号为例详细说明如何提交。
- 方式1,在本地运行完相应的代码以后,或者通过任意方式得到预测结果文件以后,到如下界面。
单击右上角”Submit Prediction”,进入如下界面。
将文件直接拖进去或者点击”Browse Files”,在文件资源管理器找到相应文件提交即可。
- 方式2,在Kaggle上建立Notebook,并输出,官方提供的代码如下。
output = pd.DataFrame({
'PassengerId': test_data.PassengerId, 'Survived': predictions}) output.to_csv('submission.csv', index=False) print("Your submission was successfully saved!")
在下图中,单击右上角黑色方框中的”Save Version”。
选择”Save & Run All(commit)“。并单机右下角”Save”。
然后左下角就可以开始运行了!运行完后,会有…出现,点它,再点Open In Viewer。
进入如下界面,点击”Output”。
这里就有你预测的结果。可以顺便检查一下数据集。单击”Submit”进行提交。
!!!!!!!!!!!
这里有些需要注意的点
- 提交结果格式要完全一致,数据类型要完全一致,比如我上面有张图Survived列是小数,这样会导致得0分的,必须是整数!!!
- “PassengerId”和”Survived”这两列仔细核对,不要拼错了!包括大小写。
- 在写代码时,output.to_csv()中的index必须是”False”,否则数据表中会多出一列来。
- 同理的,结果数据表千万不要多出其他列。
这里有些需要注意的点
!!!!!!!!!!!
四、如何查看你的排名
提交了以后,回到比赛的主页。点击”Leaderboard”。
单击Jump to your leaderboard position。就可以查看你的排名了。
另外,如果想查看排名前百分之几,可以在Competitions的界面,找到Your Active Competitions。将鼠标停留在你的排名那。
可以看到,笔者目前排名前15%,还只是个菜鸟。
总结
OK!现在开始,Enjoy your Kaggle!
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/129682.html