的见解
的角度来看

机器学习可以自动创建数据目录吗?

2024年8月5日

许多研究和评估问题可以用现有的调查数据来回答, 项目评估, 以及管理数据. 数据目录通过向研究人员提供不同数据集的概述和关于如何访问它们的信息,帮助支持现有数据的使用. 开发和维护数据目录需要大量的时间和资源,以确保它们是全面和准确的.

我们来自韦斯特大学和美国研究所(空气)的团队,代表美国.S. 美国劳工部(DOL), 探索了自动化机器学习(ML)算法在创建和维护就业和培训结果数据目录方面的潜力. 我们进行了文献综述, 试用手动数据目录组装过程, 并咨询了一个由计算机科学专家组成的技术工作组.

虽然当前的机器学习创新为自动化数据目录开发提出了挑战, 有一些很有希望的解决方案. 数据源的结构和可用元数据的数量各不相同, 使开发自动化程序变得困难. 此外, 即使对数据目录开发过程的一部分使用自动化也需要在人员和计算资源上进行大量投资. 然而, 人工智能(AI)是一个快速发展的领域, 文献表明,未来可能有很多机会支持自动数据收集, 包括生成式人工智能的潜在用途. 联邦机构可能会探索和使用现有的工具来满足他们的需求.

我们的短暂, 数据创新探索:机器学习能否支持数据目录开发? (PDF) 详细说明数据目录的开发过程, 自动化选项, 以及对未来探索最终利用人工智能的建议. 当使用机器学习生产面向公众的产品时, 联邦机构可能需要使用具有不同技能的人员组合, 包括数据科学家, 网站开发人员, 云计算专家, 主题专家.

艾莉森·海拉博士, 趣赢平台社会政策和经济研究的副总裁和这项工作的项目主管, 总结这项研究:“这是与DOL首席评估办公室(CEO)工作人员的一次伟大合作,不仅因为我们探索了新技术可以在多大程度上支持研究人员, 而是因为首席执行官想分享我们的经验教训,尽管发现自动化数据目录目前是不可行的. 通过参与该领域并确定下一步, 趣赢平台, 空气, 和首席执行官们正在为实现一个未来做出贡献,在这个未来,我们可以进一步实现数据集的民主化,以满足迫切的就业和培训信息需求.”

的见解

与我们的专家深入探讨

查看所有见解

我们能帮什么忙??

我们欢迎来自求职者、合作者、潜在客户和合作伙伴的信息.

保持联系

想和我们一起工作?

你会有很棒的同伴.

探索职业
回到顶部