Stability开源类ChatGPT模型!上线14小时,狂揽超4.8k星,支持商业化

2023-04-22 07:39:04 来源:凤凰网

编译 | 吴菲凝


(资料图片仅供参考)

编辑 | 李水青

智东西4月20日报道,开发出AI图像生成工具Stable Diffusion的初创公司Stability AI发布并开源该团队训练的大语言模型StableLM。该模型的Alpha版本有30亿和70亿个参数,接下来还将推出150亿至650亿参数的模型。用户已经可以从GitHub等开源平台上下载StableLM。

与公司在2022年开发的Stable Diffusion AI图像模型一样,StableLM支持知识共享4.0协议,开发者可以在遵守协议的情况下,自行查看、使用、调整StableLM基础模型,并将其用于商业或研究目的。

开源地址:

https://github.com/stability-AI/stableLM/

测试地址:

https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat

一、推出Stable Diffusion“兄弟模型”,入局大语言模型竞赛

Stability AI是推出了全球著名文本生成图像平台Stable Diffusion的公司,它也是最早开源扩散模型的平台之一。图像模型Stable Diffusion主要用于图像生成,根据用户提供的文本描述来绘制图像,是一款具有革命性意义的图像模型,其主要竞争对手是Midjourney。

▲由Stable Diffusion绘制的图像

此次通过推出StableLM模型套件,Stability AI旨在展示一款小型、高效的模型如何通过适当的训练来提高自己的性能,该模型也代表着所有人都将使用上基础AI技术,公司以文本、图像等多种方式对其进行训练。

与其竞争对手ChatGPT一样,StableLM旨在有效地生成文本和代码。StableLM的发布建立在非营利性研究中心EleutherAI开源早期语言模型的基础之上。

Stability AI在开源早期语言模型方面经验丰富,曾经发布过GPT-J,GPT-NeoX和Pythia套件,这些模型都是在The Pile开源数据集上进行训练的。

今日发布的StableLM在更大版本的开源数据集The Pile上进行训练,该数据集包含来自各种来源的信息,包括维基百科(Wikipedia)、问答网站Stack Exchange和生物医学数据库PubMed,该数据集的规模是The Pile的三倍,包含1.5万亿个tokens(字符),其超大规模使得StableLM在会话和编码上具有超高性能,但是它目前只有30-70亿个参数,而GPT-3有1750亿个参数。

与Meta的LLaMA语言模型相比,StableLM模型在1亿个tokens上针对7亿个参数进行了训练。

在公司官网发布的《Stability AI Launches the First of its StableLM Suite of Language Models》这篇文章中,Stability AI还宣布StableLM套件包括一组经过指令微调的研究模型,使用了5个最近的开源数据集组合进行对话代理,包括斯坦福大学的Alpaca,Nomic-AI的GPT-4all,RyokoAI的ShareGPT52K数据集、Databricks实验室的Dolly和AI初创公司Anthropic的HH,并将发布这些模型作为StableLM-Tuned-Alpha版本,公司用斯坦福大学的Alpaca模型进行了微调。

二、聊天、写小说、编代码,ChatGPT会的它都会

据Stability AI官网称,语言模型是数字经济的支柱,每个人都应该为自己的设计发言。通过提供对模型的细粒度访问,公司希望鼓励可解释性和安全性技术的发展,超越封闭模型所能达到的范围。该公司的模型现已在其GitHub存储库中开源,公司还补充,完整的技术报告中记录了模型的规格和训练设置数据,将会在不久的将来发布。

以下是StableLM模型在一些具体场景下的使用效果:

1、聊天

2、写作

3、创作

4、代码生成

Stability AI也在寻求发展其团队,并正在寻找在LLM方面经验丰富的个人,有相关经验的开发者可以在公司官网上申请加入团队。

除了StableLM套件的发布,Stability AI还启动了RLHF计划,并与Open Assistant等社区合作,创建开源AI助手数据集。该公司表示未来将发布更多模型,并称很高兴与开发人员和研究人员合作,推出StableLM套件。

结语:大模型不断涌现,“小而美”也能实现多功能

在GitHub演示中,StableLM已展示出日常聊天、书信撰写、小说创作、代码编写等功能,或许在未来进一步的训练下,StableLM能将自己的功能反哺给Stable Diffusion,形成一个完整的AI生态闭环,并在Stability AI成熟的技术支持和丰富的开源项目经验下,让“小而美”模型也能实现多场景、多功能应用。

Stability AI自去年8月发布AI图像模型Stable Diffusion以来,在AIGC领域备受关注,公司市值随之水涨船高。据知情人士透露,今年3月开始新一轮融资后,公司估值将达40亿美元。此次新模型的推出或将再助Stability AI融资一臂之力。

标签

「热点排名」杭州肤康-专业治疗紫癜|热推荐

  杭州肤康-专业治疗紫癜  杭州肤康是专业治疗紫癜的医疗机构,以*

2023-06-25 16:18:40

顽固性呃逆有什么好的治疗方法_导致顽固性呃逆的原因

1、顽固性呃逆又称膈肌痉挛,是由于膈肌、膈神经、迷走神经和中枢神经

2023-06-25 16:05:47

华鑫证券-传媒新消费行业周报:震荡中展望2023下半年-230625

▌本周观点更新2023年端午节前传媒板块热门个股回调,情绪面的短期释放

2023-06-25 15:06:18

钙钛矿,何时能把光伏换新天?

钙钛矿,何时能把光伏换新天?随着全球绿色经济热度上升,如何获得更多

2023-06-25 14:35:27

每日速读!山水人文电影《白沙溪》在沪首映,解读绿水青山下的幸福密码

昨日,山水人文电影《白沙溪》全球首映式暨走进“长三角”婺城文旅推介

2023-06-25 14:00:25

2023“在西宁”城市电音节掀起夏日狂欢

图为2023“在西宁”城市电音节演出现场。 张海雯 摄中新网西宁6月25

2023-06-25 13:12:26

上海市教育考试院建议考生:填志愿“广种博收”增加选择机会

“如果说寒窗十二年苦读的成果,给了大家一把打开大学校门的钥匙,那么

2023-06-25 12:53:07

图表工具下包含的选项卡个数为_图表工具|全球观点

1、点击随意一张图表,就进入到图表工具了。2、设置方法如下:首先在电

2023-06-25 12:08:29

赏民俗品文化 欢度端午假期_即时看

央视新闻客户端消息(新闻联播):端午假期,人们出游赏景、体验民俗,在

2023-06-25 11:43:27

天天微动态丨1.06亿人次出游!端午节假期国内旅游收入373.10亿元

松花江网,是经国家互联网信息办公室批准的国家一类新闻网站,吉林省重

2023-06-25 10:56:33
x 广告
x 广告

Copyright  2015-2022 南极粮油网版权所有  备案号:粤ICP备2022077823号-13   联系邮箱: 317 493 128@qq.com