文件名称:
CensusNameGender:用于构建和分析美国人口普查名称映射到Gender的存储库。 资料来源:https://www.ssa.govOACTbabynameslimits.html-源码
开发工具:
文件大小: 50mb
下载次数: 0
上传时间: 2021-02-21
详细说明:人口普查名称性别
用于构建和分析美国人口普查名称映射到性别的仓库。 资料来源: :
随着数据和分析的建立,我将添加到描述中。
描述
我想探索一个有趣的挑战,这些挑战正面临着使用机器学习基于非性别因素评估信用价值或就业情况的公司。 尽管性别从来都不是算法的一部分,但其中的一些算法已显示出偏见和歧视性(请参阅Apple Card和Goldman Sachs, )。
通常,公司不会收集性别信息,但是为了评估算法,需要为数据分配性别(男对女)。 一种方法是使用美国人口普查数据。 此数据根据一个人的出生年份和地区来计算该人的每个名字的性别出现次数。
有许多名称显然是按性别键入的,并且始终显示为“男”或“女”。 但是,许多名字并不清楚是男性还是女性。
该存储库的目的是开发一个模型,该模型可用于基于名称的特征来确定名称的性别。
脚本目录
001_mk_data.r-创建name_gende
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.