登陆注册开启辅助访问

加拿大新闻网 › 首页 ›新闻› 科技 › 查看内容

斯坦福“草泥马”火了:100美元就能比肩GPT3.5

加新网CACnews.ca| 2023-3-17 13:27 |来自: 量子位

斯坦福,Alpaca

一夜之间，大模型界又炸出个big news！

斯坦福发布Alpaca（羊驼，网友口中的“草泥马”）：

只花100美元，人人都可微调Meta家70亿参数的LLaMA大模型，效果竟可比肩1750亿参数的GPT-3.5（text-davinci-003）。

而且还是单卡就能运行的那种，甚至树莓派、手机都能hold住！

还有一个更绝的“骚操作”。

研究所涉及到的数据集，是斯坦福团队花了不到500美元用OpenAI的API来生成的。

所以整个过程下来，就等同于GPT-3.5自己教出了个旗鼓相当的对手AI

。

（薅羊毛高手……）

然后团队还说，用大多数云计算平台去微调训练好的模型，成本也不到100美元：

复制一个GPT-3.5效果的AI，很便宜，很容易，还很小。

而且团队还把数据集（秒省500刀）、代码统统都给开源了，这下子人人都能去微调个效果炸裂的对话AI：

项目在GitHub发布才半天时间，便已经狂揽1800+星，火爆程度可见一斑。

Django联合开发者甚至对斯坦福的新研究用“惊天大事”来形容：

不仅如此，斯坦福团队还搞了个demo，在线可玩的那种。

话不多说，我们现在就来看看这个“草泥马”的效果。

比肩davinci-003的草泥马Aplaca

在斯坦福官方的演示中，他们先小试牛刀地提了一个问题：

什么是羊驼？它和美洲驼的区别是什么？

草泥马Aplaca给出的答案较为干练：

羊驼是一种小型骆驼科动物，原产于秘鲁、玻利维亚、厄瓜多尔和智利；它比美洲驼小，羊毛更细，也没有驼峰。

而后又简单的介绍了二者群居生活的不同。

同样的问题若是交给ChatGPT（GPT3.5-turbo），则答案就不会像草泥马Aplaca那般简洁：

对此，团队给出的解释是：

Alpaca的答案通常比ChatGPT短，反映出text-davinci-003的输出较短。

而后团队演示了让草泥马Alpaca写邮件：

写一封e-mail祝贺被斯坦福大学录取的新生，并提到你很高兴能亲自见到他们。

草泥马Alpaca对于这个任务也是信手拈来，直接给出了一个像模像样的邮件模板：

难度再次进阶，团队这次提出了让草泥马Alpaca写论文摘要的需求：

写一篇经过深思熟虑的机器学习论文摘要，证明42是训练神经网络的最优seed。

草泥马Alpaca给出的答案从内容上来看，非常符合大多数论文的摘要形式：试图回答什么问题、用了什么方法、结果如何，以及未来展望。

当然，也有迫不及待的网友亲自下场试验，发现草泥马Alpaca写代码也是不在话下。

不过即便草泥马Alpaca能够hold住大部分问题，但这并不意味着它没有缺陷。

例如团队便演示了一个例子，在回答“坦桑尼亚的首都是哪里”的问题时，草泥马Alpaca给出的答案是“达累斯萨拉姆”。

但实际上早在1975年便被“多多马”取代了。

除此之外，若是亲自体验过草泥马Alpaca就会发现，它……巨慢：

对此，有网友认为可能是使用的人太多的原因。

笔记本、手机、树莓派都能跑

Meta开源的LLaMA大模型，刚发布几周就被大家安排明白了，单卡就能运行。

所以理论上，基于LLaMA微调的Alpaca同样可以轻松在本地部署。

没有显卡也没关系，苹果笔记本甚至树莓派、手机都可以玩。

在苹果笔记本部署LLaMA的方法来自GitHub项目llama.cpp，使用纯C/C++做推理，还专门对ARM芯片做了优化。

作者实测，M1芯片的MacBook Pro上即可运行，另外也支持Windows和Linux系统。

还是这个C++移植版本，有人成功在4GB内存的树莓派4上成功运行了LLaMA的 70亿参数版本。

虽然速度非常慢，大约10秒生成一个token（也就是一分钟蹦出4.5个单词）。

更离谱的是仅仅2天之后，有人把LLaMA模型量化压缩（权重转换成更低精度的数据格式）后成功在Pixel 6安卓手机上运行（26秒一个token）。

Pixel 6使用谷歌自研处理器Google Tensor，跑分成绩在骁龙865+到888之间，也就是说新一点的手机理论上都能胜任。

微调数据集也开源

斯坦福团队微调LLaMA的方法，来自华盛顿大学Yizhong Wang等去年底提出的Self-Instruct。

以175个问题作为种子任务，让AI自己从中组合出新的问题以及生成配套答案实例，人工过滤掉低质量的，再把新任务添加到任务池里。

所有这些任务，之后可以采用InstructGPT的方法让AI学会如何遵循人类指令。

套娃几圈下来，相当于让AI自己指导自己。

斯坦福版Alpaca，就是花了不到500美元使用OpenAI API生成了5.2万个这样的示例搞出来的。

这些数据同样开源了出来，并且比原论文的数据多样性更高。

同时还给出了生成这些数据的代码，也就是说如果有人还嫌不够，可以再去自行扩充微调数据，继续提高模型的表现。

微调代码也会在HuggingFace官方支持LLaMA后放出。

不过Alpaca最终的模型权重需要Meta许可才能发布，并且继承了LLaMA的非商用开源协议，禁止任何商业用途。

并且由于微调数据使用了OpenAI的API，根据使用条款也禁止用来开发与OpenAI形成竞争的模型。

One More Thing

还记得AI绘画的发展历程吗？

2022年上半年还只是话题热度高，8月份Stable Diffusion的开源让成本下降到可用，并由此产生爆炸式的工具创新，让AI绘画真正进入各类工作流程。

语言模型的成本，如今也下降到了个人电子设备可用的程度。

最后还是由Django框架创始人Simon Willison喊出：

大语言模型的Stable Diffusion时刻到了。

免责声明：本网转载的文章仅为传播更多信息之目的，本网未独立核实其内容真实性，文章也不代表本网立场。如文章侵犯了你的权利，请联系我们修改或删除。本网提供的内容，包括并不限于财经、房产类信息，仅供参考，不构成投资建议；本网内容，包括并不限于健康、保健信息，亦非专业意见、医疗建议，请另行咨询专业意见。本网联系邮箱：contact@cacnews.ca

斯坦福,Alpaca

最新评论

今日推荐

安省韩裔律师引用ChatGPT虚假案例被停牌　谎称学生所为再被揭

多伦多 5 小时前

81岁秦沛荣升爷爷徒手健身展现神级体能

娱乐 5 小时前

伊朗报复攻击约旦基地美军2死1失联美立即回击再炸伊境

国际 5 小时前

开战以来规模最大俄48枚弹道飞弹空袭基辅至少1死16伤

国际 5 小时前

“我被强奸” 广东少女早恋被管束 1个谎害父坐2年牢

中国 5 小时前

不是分居吴宗宪认了和张葳葳离婚12年叹：我不是好老公

娱乐 5 小时前

42岁佟丽娅出席某活动，晒最新性感美照，网友：自信后太亮眼

娱乐 5 小时前

一首歌吃一辈子：《上海滩》版税连收46年

娱乐 5 小时前

前脚否认喜讯，后脚官宣大婚，霍启山婚讯反转

娱乐 5 小时前

日本人对印度“破口大骂”，是多年积怨的爆发

国际 5 小时前

48小时新闻排行
7天新闻排行

太幸运! 大温华人中$200万大奖立马要买新房全家乐坏!

对加拿大再加关税！山火浓雾飘进美国那个人又怒了；890处正在燃烧，多数已失控

遭遇“留学断供”后，她在洛杉矶上门做饭年入80万

长春朝鲜餐厅：她们拒谈身世、不合影、不嫁中国，三年后神秘消失

一句话惹杀机北京21岁女子命丧家中凶手竟是生父

为躲检查，我将马岛横幅藏私处后塞进塑料瓶扔进场

加拿大首例！多伦多亚裔女律师使用ChatGPT惹祸, 被暂停执业

金正恩不再是朝鲜人唯一偶像

列治文华裔警员危险驾驶撞伤多人遭起诉

美媒：中国刚刚抹去了美国在AI领域的领先地位

28死73伤! 酒吧爆发恐怖大火烈焰狂喷顾客烧成火人逃命卫生间挤满遗体!

列治文平均寿命89.4岁冠绝卑诗省四大秘方解密

"能说会道"的印度裔高管们正在被华人技术派挤下神坛

美国政坛巨震!川普重要盟友、参议员格雷厄姆突然病逝领导人们纷纷哀悼

恐怖! 突发7.3级强震北美海啸警报拉响居民疯狂逃命多国大楼摇晃!

惊! 多人查出癌症! 富人区一月打17种农药, 几乎天天喷, 疑被宠物狗带回家

一出门眼睛就刺痛! 加拿大山火失控数千人紧急撤离天空变橙色!

太惨! 60岁老人黄石公园被野牛撞飞抛到2米多高多处骨折!

千万别碰上！加拿大人最怕的三大意外开支，摊上一个近半家庭受不了

天才科学家之死中国半导体研究员王丹豪在美国自杀前发生了什么

今日焦点

开战以来规模最大俄48枚弹道飞弹空袭基辅至少1死16伤

7月19日在乌克兰基辅街头市场附近的俄罗斯飞弹袭击现场，当地居民正在清理残骸和变质...

“我被强奸” 广东少女早恋被管束 1个谎害父坐2年牢

广东清远一名少女因不满父亲对其早恋的严厉管束，竟凭空捏造遭父亲性侵害其坐牢，引发...

日本人对印度“破口大骂”，是多年积怨的爆发

7月1日，高市早苗访问印度，跟莫迪秀了一番恩爱，哥哥妹妹打得火热。双方在《联合声明...

纽约时报：黄瓜有多健康？

当塔夫茨大学医学院营养与公共卫生副教授金伯利·董（音）列举每口营养价值最高的果蔬...

中国凉席被疯抢老外睡一晚后发出灵魂拷问

德国法兰克福一家电器卖场里，空调和风扇区域的货架几乎被搬空，安装预约甚至排到了几...

女参加婚礼遭新郎强吻!失去意识“全裸醒来”惊觉遭性侵

▲女子参加婚礼，却被新郎性侵。美国宾州一名新郎遭控在大喜之日当晚，在一处住宅内性...

比亚迪确认2026年底进军加拿大！售价$2.5万起，多伦多率先落地

比亚迪（BYD）已正式宣布，将于 2026 年底在加拿大启动乘用车销售。公司执行副总裁 St...

悲剧! 加拿大70岁夫妇湖边钓鱼度假, 遭黑熊袭击双双身亡

萨斯喀彻温省里贾纳（Regina）一对70多岁的退休夫妇 Jay MacDonald 和 Deb MacDonald...

1110亿美元收购华纳兄弟，可能又没戏了

好莱坞又出大事了。7月13日，加州牵头的12个州检察长提起反垄断诉讼，要求阻止派拉蒙...

中国达人秀选手沦邪教主!涉杀女信徒,多人追随签“身体之约”

▲刘凯潇会录制歌曲上网宣传。纽西兰一名自封“教主”的中国音乐人刘凯潇（Kaixiao Li...

温哥华加拿大中国美国国际
地产教育财经移民娱乐博览华人

旗下公众号

关注获得及时、准确、全方位的新闻消息

Copyright © 2012-2020 CACnews.ca All Rights Reserved 版权所有

关于我们|联系我们|广告服务| 免责声明|隐私保护|服务协议|使用协议

返回顶部