欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.7.24

今日要闻

Meta 发布新一代开源大模型 Llama 3.1

MoonBit 构建系统正式开源

moon 是 MoonBit 的构建系统,为 MoonBit 项目提供编译构建,自动化测试工具(集成 expect test),覆盖率测试、包管理器等功能,此外,moon 作为 MoonBit 语言编译工具链的重要组件,与 IDE 紧密结合,为 IDE 分析代码提供了详尽的项目结构和依赖等信息。

moon 还为集成开发环境(IDE)提供了详尽的项目结构和依赖等信息,这对于对延迟极为敏感的 IDE 场景至关重要。moon 通过优化核心构建步骤的性能,确保了即使在高度交互的开发环境中也能提供流畅的用户体验。

开源信息:https://github.com/moonbitlang/moon

腾讯开源PhotoMaker换脸神器再升级

还记得腾讯去年整的那个PhotoMaker吗,当时刷爆了朋友圈。就是可以把吴彦祖变成苏大强的那个换脸神器。现在它进化了,叫PhotoMaker V2。

你只需要上传几张自己的照片,然后给它一些提示词,就能生成自己在各种场景、不同风格的照片。

它的工作原理也很简单。就是把你上传的这些图片进行不断的堆叠,创建成一个统一的ID嵌入,用来保持人物特征的一致性。并以此为基础,再根据你输入的指令去生成图片。基于这种方法,PhotoMaker可以在几秒钟内完成个性化的人物图像定制,而且无需额外的LoRA训练

这次的PhotoMaker V2在保持原有优势的基础上,在ID保真度和控制能力等方面有了进一步的提升。


今日观察

– 微博 高飞

LLM模型大小竞争愈演愈烈

扎克伯格称用闭源防中国行不通

– 微博 观察者网

变的是数据来源,没变的是数据质量

– 微博 宝玉xp

媒体观察

大模型格局变天:Llama 3.1 诞生,开源首次击败当今最强闭源模型

Meta发布最强AI模型,扎克伯格公开信解释为何支持开源?

扎克伯格在脸书上发表了题为“开源AI是未来发展之路”的公开信。他表示,重要的是,AI这项技术不应该由少数几家巨头公司控制,包括他自己的公司。开源AI能够让技术人员了解强大AI模型的创建过程,并利用这些知识开发他们自己的AI程序。

 凤凰网科技

专访成都晓多科技:国产芯片生态亟需各方通力去“磨”

 红星新闻

微软全球宕机加速巨头洗牌

AI催化下,全球数字化加速狂奔。在万物互联的时代,网络安全必须始终被摆在最重要的位置,任何小错误都可能被无限放大,造成难以挽回的损失。 

微软“蓝屏”事件给一直被寡头垄断的行业投入一枚炸弹,新格局已在暗中酝酿。

全天候科技

澎湃新闻

周鸿祎:要把大模型“从原子弹变成茶叶蛋”

“OpenAI试图创造出像神一样的超级人工智能。他们认为,全世界所有的企业、政府、个人,只要用OpenAI的服务就够了。”360集团创始人周鸿祎戏称,OpenAI看起来是在造“原子弹”。

但他认为,这种方式并不适用于国产大模型的发展,要把大模型拉下神坛,才可以引发更大规模的工业革命。

i黑马

中国信通院正式启动AI大模型算子适配生态建设工作

第一批大模型算子级适配测试主要围绕大语言模型算子的丰富度、功能、性能开展,现已正式启动报名。后续将迭代更新算子列表,分类分批持续开展。

 CAICT人工智能

投资人看AI:投大模型风险可控,大厂VS独角兽胜负难料

在大厂与独角兽的赛跑中,谁能胜出?这是两种完全不同风格的路线,大厂的出发点是,用大模型技术将旗下整个应用场景重新做一遍,创业公司的打法则是,先从基座出发,将模型往应用上做。

第一财经


今日推荐

开源项目

iorate/ublacklist

开源日报 | Meta发布最强AI模型;微软全球宕机加速巨头洗牌;扎克伯格称用闭源防中国行不通;LLM模型大小竞争愈演愈烈插图

https://github.com/iorate/ublacklist

uBlacklist 是一个浏览器扩展程序,可以阻止特定网站出现在 Google 搜索结果中,该扩展支持 Chrome、Firefox 和 Safari。

每日一博

从打点平台谈打点治理

本文介绍了打点治理的概念和其对于数据质量保障的重要性,分享了日志中台在打点治理方面的解决方案与实践经验。文章从用户痛点和打点治理的难点出发,介绍了日志中台如何通过质量标准的制定、在线化流程的建设和相应的配套工具来解决这些问题。

图片


用户观点

扎克伯格: Llama 3.1会成为开源AI标准,就像当年Linux一样

  • 观点 1:可是李彦宏说开源模型是智商税啊……
  • 观点 2:诶,所以说3的400b模型不放出来了(?)
  • 观点 3:李彦宏说的每一句话都是智商税
  • 观点 4:Zuckerberg开放AI的决定我是支持的。
  • 观点 5:可惜国内网民只知道百度,连llama都没听说过。就算llama4出来后全面超过所有闭源模型了,百度肯定都会照样宣传它自己是最强的,照样有人信

我用十条优化措施,将Redis费用降本46万/月

  • 观点 1:我用的不花一分钱!没办法省了!
  • 观点 2:这个体量之前光redis一月就能百万费用,整个服务上千万了吧,可怕
  • 观点 3:用com.github.fashionbrot:tlv:0.0.2压缩更狠支持gzip压缩,比protobuf序列化更狠
  • 观点 4:优化最大的 使用压缩算法 不是把内存压力转到 计算上了吗
  • 观点 5:我不用,立省100%

相信开源力量,MoonBit 构建系统正式开源!

  • 观点 1:啥意思,用 rust 构建了一个新语言吗?
    • 观点 2:用开源的rust构建了一个开源的moon,用于构建开源的moonbit。
  • 观点 3:牛牛牛,不过最好不要这么比。一门编程语言发展如何,也是“领域”驱动的,构建工具的某些性能行不行,几乎不影响语言发展,因为构建工具是容易改进的,甚至是可以替换的。那么MoonBit所瞄准的“领域”,究竟是不是一个可以大发展的领域呢? 云计算和边缘计算的场景需求是什么,这个领域是否空缺一门语言? 如果把优势放在“工具”和“更美的语法”上,只是利于学习,而不能构成语言长远发展的根基,前车之鉴是Ruby。

我们程序员就是这样深情 

  • 观点 1:基础模型用chatglm就行,然后了解一下LoRA微调的方法,把数据编制为prompt进行微调就可以了。不难,但是编制prompt比较繁琐,尤其是五年聊天数据这么大的量,会很枯燥。
    • 观点 2:应该训练不出来,因为大部分都是男方的消息
  • 观点 3:用数据训练出来的模型聊天。还是会分手的
  • 观点 4:已读不回就老实了
  • 观点 5:存了她这么多声音文字图像数据不就是等这一天吗
  • 观点 6:实话实说兄弟们,到底有没有
    • 观点 7:恋爱脑,叉出去
  • 观点 8:训练电信诈骗模型呗
  • 观点 9:恩,哦,好的,在洗澡,好困,先睡了
  • 观点 10:纯爱BOT
  • 观点 11:把数据喂给OpenAI或者kimi都可以吧
    • 观点 12:什么也顶替不了她,都是冷冰冰的数据和算法,哪怕跟她再像也不是她
  • 观点 13:急需,请分享
  • 观点 14:告你侵犯隐私数据你就老实了
  • 观点 15:这个好像有人以前做过类似的。。再者,多年前上古时代就有人手写伪春菜对话来达到伪人效果
  • 观点 16:感觉似乎挺简单,写个脚本finetune个llama之类的
  • 观点 17:个性化定制?QWQ,如果再借来别处的相似数据呢?……唉,要说还原成那人觉得跟过去那人相同有些难度,更何况真实的人也会变不会一成不变的说话方式等等
  • 观点 18:我好像发现了一条新赛道

—END—

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

开源日报 | Meta发布最强AI模型;微软全球宕机加速巨头洗牌;扎克伯格称用闭源防中国行不通;LLM模型大小竞争愈演愈烈插图2 

免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表一休教程网的观点和立场。