开普勒计划
特雷弗·圣地亚哥(Trevor Santiago)
用开普勒数据对系外行星进行分类
该项目的目的是了解我们如何预测开普勒感兴趣的物体(KOI)是否被确认为系外行星或假阳性。 我主要关注的是获得尽可能最高的准确性,但同时也关注对数损失以了解模型的可信度。
数据
我使用的数据集来自 ,但最初来自NASA。 目标变量是koi_pdisposition ,其值CONFIRMED和FALSE POSITIVE和相当均衡。 广泛的数据字典可从美国航空航天局。
方法
幸运的是,数据集已经相当整洁。