1. 百川智能推出70亿中英文预训练大模型baichuan-7B,提供1.2万亿token、万级别超长动态窗口以及深度优化训练流程,有望在文本生成、文本分类问答系统、机器翻译等多个领域应用。
  2. 百度文心一格联合京东,通过AI技术实现线下广告创意的快速生成,节省时间和成本,提升新鲜感
  3. 高通演示手机15秒跑亿级大模型:团队专门基于移动端AI软硬件技术,对开源模型进行了优化,据高通介绍,在这波生成式AI浪潮下,相比单纯借助云端算力处理AI模型,端侧的计算能力也同样能被加以利用
  4. 商汤发布了围棋机器人,最高棋力可达职业九段内置超过20000道练习题,满足从启蒙到业余五段的棋力需求。
  5. 陶哲轩自曝用了满血GPT-4:在GPT-4发布之前就从微软那里获得了访问资格,微软邀请他体验后写了一篇文章,认为人类对信息技术的期待全部需要校准
  6. 微软推出了将类ChatGPT功能的Copilot集成在ERP产品矩阵中的创新,以此来帮助企业实现降本增效,加速项目开发,提高工作效率和客户体验。
  7. AMD发布了人工智能芯片M1300X,对标英伟达的GraceHopper系列,拥有惊人的1530亿晶体管和192GB的HBM3,开启A模型更大规模的运算。
  8. FINE-GRAINED RLHF细粒度的人类反馈强化学习:微调效果比ChatGPT更好,拯救语言模型胡说八道
  9. GPT-4满分通过MIT本科数学考试,原始版本的GPT-4开箱即用,完全不经过调优,在本次MIT考试中也拿到了90%的分数
  10. Meta CEO马克.扎克伯格考虑将开源大型语言模型LLaMA的新版本商业化,让其它公司免费使用LLaMA开发相关AI软件,允许开发者将产品用于商业用途。