周五,脸书联合创始人马克·扎克伯格宣布元平台即将向研究人员发布一种名为LLaMA(大型语言模型元AI)的新的大型语言模型。该模型由Meta的基础人工智能研究(FAIR)团队开发,旨在帮助科学家和工程师探索人工智能应用程序和功能,如回答问题和总结文档。
LLaMA的发布正值科技公司竞相推动人工智能技术的进步,并将技术整合到其商业产品中。作为CNBC值得一提的是,Meta的版本不同于竞争对手的模型,因为它可以选择从70亿个参数到650亿个参数的大小。此外,扎克伯格他说,他公司的新LLM技术——最终可以解决数学问题并进行科学研究——将向研究界开放,Meta现在正在接受访问申请。这是谷歌的LaMDA和ChatGPT该公司的基本模型尚未公开。
路透指出Meta正在加入一场日益激烈的主导人工智能技术的竞赛,这场竞赛于2022年底正式开始,由OpenAI的ChatGPT开始。就Meta而言,LLaMA的发布也代表了它对开放科学的承诺——因此选择公开发布最先进的基础大型语言模型,同时允许研究人员使用开放资源来推进他们的工作。Meta认为,与为特定目的而设计的更精细的模型不同,他们的模型将被证明是多功能的,具有多种用例。
根据Meta的说法,LLaMA的另一个不同之处在于:它需要的计算能力比以前的产品“少得多”,并且可以接受20种语言的训练,主要是基于拉丁字母和西里尔字母的语言。LLaMA拥有130亿个参数,表现应该会更好GPT-3, ChatGPT是基于这个模型构建的。Meta还将LLaMA的表现归因于“更干净”的数据和模型中提高训练稳定性的“架构改进”。
为了保持模型的完整性并防止滥用,Meta将在专注于研究用例的非商业许可下发布它。学术研究人员、政府、民间社会、学术机构和行业研究实验室将在个案基础上获得模型访问权。
Meta的推出LLaMA可能标志着一个重大的发展人工智能语言模型。这家社交媒体巨头致力于开放科学,并允许研究人员在非商业许可下进行研究,这将限制该模型的滥用。
LLaMA的多功能性和解决问题的潜力可能会让我们看到人工智能为数十亿人带来的巨大潜在利益。