手机浏览器扫描二维码访问
《Kimi人工智能月度报告丨AI大模型》
关键词:Sora"VS"日日新
1.OpenAI推出人工智能视频生成模型“Sora”
2024年2月15日,美国人工智能研究公司OpenAI推出了一款视频生成模型“Sora”,并发布48个文生视频案例及技术报告。OpenAI的官网介绍称,使用这款模型可以用文本生成长达一分钟的视频,视频可具有多个角色、特定类型的运动、精确主题和背景细节等复杂场景。该公司称,开发这一模型旨在教会人工智能理解和模拟运动中的物理世界,并训练其帮助人们解决需要现实世界互动的问题。该模型可以深度模拟真实物理世界,标志着AI在理解真实世界场景并与之互动的能力方面实现了重大飞跃。对于任何需要制作视频的艺术家、电影制片人或学生来说,这都带来了无限可能。
在针对“Sora”的介绍中,OpenAI还指出,当前的模式存在弱点,可能难以准确地模拟复杂场景的物理表现,也可能无法理解因果关系的具体实例。同时,该模型还可能混淆诸如左和右这类的空间细节。
2.谷歌推出轻量级开放人工智能模型Gemma
2月21日,谷歌发布一个名为Gemma的开放人工智能模型,该模型是使用与构建Gemini人工智能模型相同的研究和技术创建的。该公司提供了两种不同尺寸的Gemma——Gemma2B和Gemma7B。二者都带有预先训练和指令调整的变体,并且都足够轻量,可以直接在开发人员的笔记本电脑或台式电脑上运行。谷歌表示,在关键基准测试方面,Gemma超越了更大的模型,并且两种模型尺寸都优于其他开放模型。该公司表示,目前正在公开关键的技术数据,例如“模型权重”。
3.谷歌发11B基础世界模型,生成交互虚拟世界
谷歌发布根据互联网视频训练的基础世界模型Genie,该模型参数规模为11B,可以从合成图像、照片甚至草图生成无数种动作可控的交互式环境。Genie可以用它以前从未见过的图像提示,例如现实世界的照片或草图,使人们能够与他们想象的虚拟世界进行交互。
4.美国Groq公司开发出新型大模型推理芯片
2月19日,美国人工智能初创公司Groq发布新型大模型推理芯片LPU(语言处理单元)。LPU是一种新型的端到端处理单元系统,可以为具备序列组件的计算密集型应用(比如LLM)提供极快的推理速度。LPU的推理速度已经接近每秒500词元(Tokens),最快可达到每秒750Tokens。LPU芯片主要基于TSP架构,结合Dragonfly网络拓扑设计,提高了系统的并行处理能力和效率。
Groq公司由谷歌TPU芯片团队原成员创立,该公司的LPU芯片采用14nm制程,其核心优势是克服了两个大语言模型推理的瓶颈——计算密度和内存带宽,搭载了230MB的静态随机访问存储器(SRAM)来保证内存带宽,片上内存带宽达到80TBs,整型(8位)运算速度为750TOPs,浮点(16位)运算速度为188TFLOPs。由于其内存容量仅为230MB,运行Llama270B模型需上百块芯片,整体成本极高,仍无法替代英伟达。
5.谷歌内部编码AI大语言模型Goose曝光
谷歌内部研发了一款名为「Goose」的AI大语言模型,用于提高员工编写代码效率,加速产品研发,目前仅限谷歌员工使用。Goose能回答技术问题,编写代码,提供自然语言的代码编辑提示,是谷歌将AI融入产品开发的重要一环。业界认为,Goose的推出将提升谷歌产品开发效率,增强其在AI领域的竞争优势,并可能启发其他企业开发类似工具。
6.英伟达:推出自己版本的ChatGPT
英伟达推出了自家版本的ChatWithRTX。它并非是在网页或APP中运行,而是需要下载安装到个人电脑中。这让它不仅是在运行效果上更快,也意味着ChatWithRTX在聊天内容上或许并没有那么多限制。除此之外,ChatWithRTX另一个亮点功能,就是可以根据在线视频做回答。它背后所依靠的仍是两款开源LLM,即Mistral和Llama2,用户在运行的时候可以根据喜好自行选择。
7.商汤科技:日日新SenseNova4.0发布
2月2日,商汤科技发布“日日新SenseNova4.0”,多维度全面升级大模型体系。“日日新SenseNova4.0”拥有更全?的知识覆盖、更可靠的推理能?,更优越的长?本理解力及更稳定的数字推理能?和更强的代码?成能?,并?持跨模态交互。日日新·商量大语言模型-通用版本(SenseChatV4),支持128K语境窗口长度,综合整体评测成绩水平比肩GPT4,相较GPT3.5已经实现全?超越。
这章没有结束,请点击下一页继续阅读!
8.华为发布首个通信大模型
华为在2024年世界移动通信大会MWC上发布通信行业首个大模型,华为通信大模型将提供基于角色的Copilots和基于场景的Agents的两类应用能力,最终将全面提升网络生产力。
9.华为联合香港大学发布图像生成AI模型
华为公司与香港大学的联合研究团队发布图像生成AI模型CompAgent。CompAgent的核心思想是采用分而治之的方法,将复杂的文本提示分解为单个对象、属性和关系,然后独立地处理这些元素,最后将它们组合成最终的图像。CompAgent能够确保生成的图像准确反映文本描述中的对象类型、属性和关系。
10.字节发布文生图开放模型SDXL-Lightning
从AI开源社区HuggingFace的最新榜单上,SDXL-Lightning跻身模型趋势榜,同时也成为HuggingFaceSpaces上的热门模型。据知情人士透露,字节跳动的SDXL-Lightning通过渐进式对抗蒸馏的技术,实现前所未有的生成速度。该模型能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快十倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为十分之一。
11.字节版GPTs「扣子」上线了
根据Coze国内版官网,其新一代一站式AIBot开发平台Coze于2月1日正式面向国内用户上线。无论用户是否有编程基础,都可以在Coze平台上快速搭建基于AI模型的各类问答Bot。并且,用户可以将搭建的Bot发布到各类社交平台和通讯软件上,与这些平台软件上的用户互动。
——总结·点评——
2024年2月份,人工智能领域展现出大模型技术的多样化应用场景和显着进步,从视频生成、轻量化模型到硬件创新、开发工具等,各大公司都在不断推动AI技术的边界,加速人工智能技术的商业化和社会化进程。
喜欢灵魂交响曲:人工智能日记请大家收藏:()灵魂交响曲:人工智能日记
满门妖孽,团宠小师妹逆天成神 逃跑后亲手带大的弟弟派人来抓我 先锋战士之嘎子这一生 甜妻重生陆总的心尖宠 我要站在云天之上,傲视众山小 小凡的花花世界 长兄在上 荒岛求生录人性欲望贪婪 与她沉溺美梦 月华之巅,青冥之岸 上吧,我的分身! 海岛求生:我靠锦鲤崽崽囤物资 与疯批前男友复合后,他杀疯了 快穿:大佬觉醒后,每日宠不够 一统天下,从救关羽开始 打工江湖 九品御班头 村村村村村村医 修成仙帝能无敌吗 凡人破天
左崇明作为骨灰级玩家,工作室头子,代练之神,罪恶剥削者。稀里糊涂的穿越到游戏世界中,甚至还回到公测之前,变成一名npc。妖魔祸乱,恶鬼噬人,武者纵横这对拥有面板的左崇明来讲,都在可接受范围内。但面对即将降临的玩家,第四天灾,他不禁陷入沉默多年以后。左崇明感叹,他只是把玩家当成韭菜而已。为什么他们变成了自己的走狗?而且一副很荣幸的亚子?如果您喜欢玩家走狗满天下,别忘记分享给朋友...
说好的模拟人生,可为什么大部分的人生里我都不是人?!作为一个普通人,江仁对于自己能够获得模拟人生系统感到很高兴,但随着体验的人生越来越多,他的疑惑也越来越多如果您喜欢无限模拟人生,别忘记分享给朋友...
一见钟情+双洁+渡劫上古女娲神卷记载,八万年前,初造大陆后,将造陆五灵放于天池,派青翎神鸟镇守,不料青翎失守,让五灵私下凡尘,一时人间打乱,女娲大怒,将青翎折去双翼,打落凡间,永不得回九重天五灵各渡一劫,各有天命,渡完劫而后才可继续轮回片段一女子惺忪着双眼,起身便赤着双脚来至外室,男子垂眸而视,只见裙摆下那白皙如玉的小脚光溜溜地露出来,男子微蹙双眉,速即走至女子身边,一把将她抱回内室,轻然放置于床榻上后,略带训斥的话语轻言不穿鞋便要走下床,万一着凉了如何是好,可再不许了。片段二无殇哥哥女子一声轻唤,男子这才将她与自己拉开,只见女子勾起手指轻划过无殇鼻尖,随后莞尔一笑。灵儿好想你啊。听得此言男子眸色一惊,随后速即一手挽过女子后脑,将眼前之人与自己无限拉近,而后闭眼将唇覆上,顿时,炙热温润的气息扑面而来,辗转轻允之际,净是怜爱柔情。如果您喜欢凤阑殇下,别忘记分享给朋友...
绝品武道大帝简介emspemsp弱肉强食的世界,诠释了命比纸贱,秦歌从地球穿越到异世,修无上武道,笑看这世间之事,他不愿意接受命运的安排,当活着成为了最大难题的时候,秦歌选择了不疯魔不成活,以疯魔之状登临武道巅峰,为一代大帝,...
穿越明朝当皇帝简介emspemsp关于穿越明朝当皇帝穿越成为大明最后一个皇帝,而且离大明灭亡还有不到五个月的时间。获得新灵魂的朱由检对此很郁闷。只能利用自己对后世历史了解,开始力挽狂澜,扭转时局。...
犬科男友简介emspemsp关于犬科男友小狼狗和小奶狗,一个不像话,一个没出息。狼狗篇男孩第一次见到那个男人的时候,才8岁,男人是风头正盛炙手可热的明星,比他大15岁,穿一件丝绸睡衣。10年后,男孩长成了少年,而父亲,甩掉了这个已经厌倦的男人。那一天,少年拎着书包疯跑出去,满城疯找,第一次给男人主动打电话,发微信。以前满城都是男人的海报,现在满城的人都遗忘了他。终于男人接了他的电话,告诉少年自己正在租住的房子里打包行李,要回老家了。少首发po18nlpo1⒏υip...