欧陆娱乐

  • 摩尔线程开源音频理解大模型MooER:基于国产全功能GPU训练和推理

  • 发布日期:2024-08-26 08:56    点击次数:131

摩尔线程AI团队在该工作中开源了推理代码和5000小时数据训练的模型。

IT之家 8 月 23 日消息,摩尔线程开源了音频理解大模型 —MooER(摩耳),是业界首个基于国产全功能 GPU 进行训练和推理的大型开源语音模型。

基于摩尔线程夸娥(KUAE)智算平台,MooER 大模型用 38 小时完成了 5000 小时音频数据和伪标签的训练。

MooER 不仅支持中文和英文的语音识别,还具备中译英的语音翻译能力。在 Covost2 中译英测试集中,MooER-5K 取得了 25.2 的 BLEU 分数,接近工业级效果。

摩尔线程 AI 团队在该工作中开源了推理代码和 5000 小时数据训练的模型,并计划进一步开源训练代码和基于 8 万小时数据训练的模型。

MooER 的模型结构包括 Encoder、Adapter 和 Decoder(Large Language Model,LLM)三个部分,具体的模型参数规模如下:



相关资讯

倪海厦《黄帝内经》笔记(三五四)第三十九篇.举痛论篇

业务范围 2024-09-02
【原文】厥气客于阴股,寒气上及少腹,血泣在下相引,故腹痛引阴股。 【原文解释】寒邪侵袭于阴股,寒邪循厥阴经上逆而影响少腹。血行滞涩,经脉拘急,上下相引,故腹痛而牵引阴股作痛。 【倪师解读】“厥气”,即寒逆之气。“阴股”,指大腿内侧,鼠蹊部。...

百亿量化私募陷“控制权纠纷”沸沸扬扬,鸣石投资实控人解除创始人职位?实情究竟如何?会否大面积赎回?

业务范围 2024-08-22
财联社(上海,记者 刘超凤 周晓雅)讯,10月13日,百亿量化私募“鸣石投资”疑似公司控制权纠纷传遍量化投资圈。根据爆料内容,鸣石投资实控人、总裁李硕公布解除了创始人、首席策略负责人袁宇在公司的职位和其对策略组的管理,直接触发了“关键人条款...

范丞丞疑似养嫂子事件曝光,他粉丝破防暴走,请求范九亿出面澄清

业务范围 2024-08-22
范丞丞疑似养嫂子这事算是盖不住了,虽然工作室发了声明,但是越来越多的证据挖出,粉丝彻底暴走平破大防了。 问题是粉丝前段时间刚骂过范九亿,说她现在糊了还蹭弟弟热度,不仅自己没有起来,还连累范丞丞被骂“吸血鬼”“资源咖”,结果现在范丞丞出事了,...
    友情链接:

Powered by 欧陆娱乐 @2013-2022 RSS地图 HTML地图