Dataset:titanic(泰坦尼克号)数据集(是否获救二分类预测)的简介、下载、案例应用之详细攻略
目录
titanic(泰坦尼克号)数据集的简介
1、titanic数据集各字段描述及简介
titanic(泰坦尼克号)数据集的下载
titanic(泰坦尼克号)数据集的案例应用
titanic(泰坦尼克号)数据集的简介泰坦尼克号沉船事故。1912年,当时隶属于英国的世界级豪华客轮泰坦尼克号,因在处女航行中不幸撞上北大西洋冰山而沉没。这场事故使得1500多名乘客罹难。后来,这场震惊世界的惨剧被详细地调查,而且遇难乘客的信息也逐渐被披露。在当时的救援条件下,无法在短时间内确认每位乘客生还的可能性。而今,许多科学家试图通过计算机模拟和分析找出潜藏在数据背后的生还逻辑,通过人工智能算法,尝试揭开这尘封了 100多年的数据的面纱。 titanic泰坦尼克号是当时世界上体积最庞大、内部设施最豪华的客运轮船,有“永不沉没”的美誉。然而不幸的是,在它的处女航中,泰坦尼克号便遭厄运,1912年4月14日23时40分左右,泰坦尼克号与一座冰山相撞,造成右舷船艏至船中部破裂,在2224名船员及乘客中,造成1517人丧生。 此次沉船事件如此严重,主要是因为当时没有足够的救生艇。有些人被获救,除了有运气因素之外,还有一些其他的因素值得分析,比如妇女、儿童、上层阶级等角色人员更可能会被获救。而titanic数据集记录了当时的状况,它被用来实现分类任务,是否获救二分类预测,预测泰坦尼克号上人员的是否获救状况。
数据集下载:Titanic - Machine Learning from Disaster | Kaggle
1、titanic数据集各字段描述及简介 VariableDefinition中文描述survivalSurvival该乘客是否获救,1是获救pclassTicket class乘客船票等级,1/2/3等舱位,一等票/二等票/三等票sexSex乘客性别AgeAge in years乘客年龄,以年为单位sibsp# of siblings / spouses aboard the Titanic乘客,在泰坦尼克号上的堂兄妹/配偶的个数parch# of parents / children aboard the Titanic乘客,在泰坦尼克号上的父母/孩子个数ticketTicket number乘客船票信息farePassenger fare乘客船票价格cabinCabin number乘客船舱信息embarkedPort of Embarkation乘客登船港口S = Southampton,
C = Cherbourg,Q = Queenstown
经常将S、C、Q分别编码为0、1、2
titanic(泰坦尼克号)数据集的下载下载地址:Titanic - Machine Learning from Disaster | Kaggle
titanic(泰坦尼克号)数据集的案例应用相关文章https://yunyaniu.blog.csdn.net/article/details/81700746https://yunyaniu.blog.csdn.net/article/details/81749734https://yunyaniu.blog.csdn.net/article/details/83833397https://yunyaniu.blog.csdn.net/article/details/86725535https://yunyaniu.blog.csdn.net/article/details/86725535 等等