【ITBEAR科技资讯】7月18日消息,苹果公司近日通过知名科技媒体9to5Mac平台发表正式声明,就外界广泛关注的OpenELM开源AI模型训练过程中使用争议性YouTube资源一事进行了澄清。苹果公司明确指出,OpenELM模型并未被应用于任何除研究以外的AI或机器学习项目,包括其内部的Apple Intelligence项目。
据非营利性新闻工作室ProofNews近期发布的深度调查报告显示,苹果在开发OpenELM模型时,确实采用了名为YouTube Subtitles的庞大数据集,该数据集规模达到5.7GB,包含约4.89亿个单词,源自超过48000个频道的173536个YouTube视频的字幕内容。尤为引人注目的是,这一数据集中还涵盖了12000多个已被YouTube平台删除的视频字幕。
苹果公司在其最新声明中重申了OpenELM模型的初衷与定位,即致力于为研究社区提供有力支持,并推动开源大型语言模型的持续发展。苹果的研究人员曾高度评价OpenELM为“最先进的开放式语言模型”,充分展现了其在该领域的创新实力与前瞻视野。
苹果公司强调OpenELM模型仅用于科学研究目的,并未涉足任何商业化的Apple Intelligence功能。同时,该模型以开源形式发布,为全球开发者提供了自由获取与探索的宝贵资源。
此外,苹果还透露,目前并无构建新版OpenELM模型的明确计划。