语音识别热点 HotNews
- CAAI AI前沿讲习班(CAAI-AIDL)第十四期:AI驱动的芯片设计 开班啦!
- Apache Spark & Paimon Meetup · 北京站,助力 LakeHouse 架构生产落地
- GPT-4o模仿人声说“不”,无意的语音生成仍是模型弱点
- 科大讯飞申请语音识别专利,提升实体词的识别效果
- 科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电
- 小中见大!第十九届中博会上的中小企业创新故事
- 中国人工智能学会 AI 前沿讲习班(CAAI-AIDL)第十三期在杭州成功举办!
- AI 驱动的芯片设计-AI前沿讲习班(CAAI-AIDL)第十四期活动成功举办
- 诚芯惯性传感:多场景、强性能、高性价比助力低速无人驾驶
- 百模论剑决赛收官日 | “人工智能+”鏖战四日,战果即将揭晓!
- 百模论剑,行而不辍;“AI+”时代,未来可期!
- GROW with SAP论坛成功举办,Acloudear两客户成为SAP全球用户标杆企业!
- 乘风破浪的“厂二代”|《你好!厂长》第八期全国首映,见证逆风翻盘的精彩人生
- 机器人焊接:优傲协作机器人的焊接革命
- 百模论剑决赛第2日 | 多赛道展演答辩,“人工智能+” 活力迸发
- 百模论剑决赛第1日 | 15支队伍首发亮相,“人工智能+”表现亮眼
- 百模论剑·首届全国“人工智能+”行业应用创新大赛决赛在成都开战!
- 科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电
- GPT-4o模仿人声说“不”,无意的语音生成仍是模型弱点
- 科大讯飞申请语音识别专利,提升实体词的识别效果
- 高通公司申请使用语音认证的设备查找器专利,使得扬声器可听见地输出警报声音以协助用户定位计算设备
- 小赛道领跑?埃及AI公司阿拉伯语语音识别准确率超越谷歌
- ChatGPT可以语音交流了
- 苹果、微软、谷歌、亚马逊、Meta 合作,将改善残疾人的语音识别
- Amazon研发人声复制技术 离世者可借语音助理重新发声
- 中国联通AI语音识别实时传译与转换 造就无界沟通新体验
- 语音合成技术分享
- 摩托车也要走入智能化时代 钱江摩托引入语音助手
- 新一代Kaldi发布将从根本上改变语音识别方式 明年将应用于小米产品
-
OpenAI ChatGPT 高级语音模式已登陆 Windows 和 Mac 平台
语音识别2024-10-31 08:10 84
IT之家 10 月 31 日消息,OpenAI 今日宣布,ChatGPT 的高级语音模式(Advanced Voice Mode,简称 AVM)现已登陆 Windows 和 Mac 平台。AVM 基于 OpenAI 最先进的 GPT-4o 模型运行,允许用户像与真人对话一样与 ChatGPT 进行交流,包括打断、停顿等自然语言行为。OpenAI ......
-
科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电
语音识别2024-09-10 14:24 2518
新智元报道 编辑:乔杨 Frey 【新智元导读】 虽然OpenAI的「Her」还是期货,但硅谷的科技巨头们已经开始相继发力语音模型。前有谷歌的Gemini Live和苹果的升级版Siri,如今巨头亚马逊和新秀Cerebras也加入了这场竞争。继OpenAI在5月发布会上展示「期货」GPT-...
-
GPT-4o模仿人声说“不”,无意的语音生成仍是模型弱点
语音识别2024-08-13 14:16 7193
在提供的案例中,AI模型发出No的声音,后用一种与红队(OpenAI雇佣进行对抗性测试的人)相似的声音继续说话。数据科学家评价称OpenAI刚刚泄露了《黑镜》下一季的剧情。 OpenAI 和机器人对话,机器人突然开始用你的声音和你说话,这并非科幻剧情,而是OpenAI...
-
语音克隆技术引发担忧,OpenAI 再次解释其文本转语音工具
语音识别2024-06-11 10:04 4717
IT之家 6 月 10 日消息,OpenAI 在几个月内第二次就其文本转语音工具进行解释,并再次强调该工具目前并未大范围开放,且未来也可能不会。 图源 Pexels 无论我们最终是否会大规模部署这项技术,让世界各地的人们理解这项技术的发展方向都非常重要,OpenAI公司...
-
智能座舱算法基础之语音识别篇
语音识别2024-02-17 08:39 5776
近年来人工智能技术快速发展,比较引人注目的包括智能语音技术、计算机视觉技术和自动语音识别技术等。其中,自动语音识别(ASR),简称语音识别,是重要的组成部分。其主要目标是把语音信号转变为相应的文字,从而让机器具有听觉功能,能够直接接收人的口语...
-
科大讯飞申请语音识别专利,提升实体词的识别效果
语音识别2024-01-07 18:27 4946
专利摘要显示,本申请公开了一种语音识别方法、装置、设备及可读存储介质。在获取待识别语音数据、确定待识别语音数据的声学特征序列之后,基于声学特征序列进行解码处理,其中,在每个解码时刻,只对该解码时刻的候选解码路径中最后一个词被判定为实体词的...
-
声音如何泄露你的隐私?美国学者谈智能语音的风险
语音识别2023-12-08 13:31 5402
2018年2月,苹果智能音箱HomePod正式在美国上市。(视觉中国/图) 图罗曾经写过一个故事:一位父亲在家里收到百货公司邮寄的母婴用品广告后,才得知他尚未成年的女儿已经怀孕。商场怎么会比女孩的家人更早知道她怀孕呢? 美国学者、宾夕法尼亚大学教授约瑟夫...
-
苹果介绍语音辅助功能:可用 iPhone 保留自己的声音
语音识别2023-12-01 19:18 4976
IT之家 12 月 1 日消息,苹果公司今天发布新闻稿,以内科医生兼残疾人权利倡导者 Tristram Ingham 为视角, 介绍了实时语音和个人语音两项新增辅助功能。 实时语音是 Apple 今年秋天推出的另一项语言辅助功能,可以帮助用户输入想说的话,并通过个人声音或系...
-
高通公司申请使用语音认证的设备查找器专利,使得扬声器可听见地输出警报声音以协助用户定位计算设备
语音识别2023-11-21 18:10 2499
专利摘要显示,计算设备可以接收由麦克风捕获的音频信号的指示,其中音频信号包括语音输入。计算设备可以至少部分地基于将语音输入与由计算设备的授权用户提供的数据进行比较来确定音频信号中的语音输入来自计算设备的授权用户并且包括与触发设备查找器功能...
-
最强开源语音克隆AI模型:Coqui TTS
语音识别2023-11-15 17:54 7826
前有HeyGen的火热大家都开始关注 语音克隆 (详情见这篇文章), 后有ChatGPT的 文本转语音 技术让大家眼前一亮! 但是ChatGPT和HeyGen虽好,可不仅要翻墙使用,而且还要购买会员才可以! 那么开源领域有没有好用的?答案是有的! 今天要介绍下2.2W的开源项...
-
小赛道领跑?埃及AI公司阿拉伯语语音识别准确率超越谷歌
语音识别2023-10-07 08:34 10647
财联社10月4日讯(实习编辑 高佳宁) 埃及领先的人工智能公司Intella在 Pre- A轮融资中从沙特投资者处成功获得了340万美元,这轮融资由沙特 HALA投资公司和沙特阿美的投资部门Waed投资公司牵头。 Intella是埃及领先的科技初创公司之一,致力于研究适合各种方...
-
ChatGPT可以语音交流了
语音识别2023-09-26 09:51 5145
OpenAI公司周一宣布,该公司的ChatGPT现在可以看、听、说,或者至少可以理解口语,用合成的声音做出反应,并处理图像。 这款聊天机器人是OpenAI自推出GPT-4以来最大的一次更新,它允许用户在ChatGPT的移动应用程序上选择语音对话,并从五种不同的合成声音中...
-
用语音控制特斯拉是怎样的体验?科技改变生活,苹果和特斯拉联动
语音识别2023-08-27 07:05 10440
苹果和特斯拉一直是我最喜欢的两个科技公司,这次它们终于迎来了联动,特斯拉APP推出了最新的版本4.24.0,新功能可以看到增加Apple快捷指令功能,也就意味着我们可以用siri控制我们的特斯拉了。 这其实并不是一个特别新鲜的功能,早在很久,第三方的小特APP...
-
砍掉“Hey”,苹果宣布iPhone/iPad语音助手唤醒词改为“Siri”
语音识别2023-06-06 06:15 5348
IT之家 6 月 6 日消息,苹果在今年的 WWDC 2023 开发者大会上, 宣布唤醒 Siri 语音助手的唤醒词正式从Hey Siri,更改为Siri。 苹果宣布用户在升级 iOS / iPadOS 17 版本更新之后,可以更容易地唤醒虚拟语音助手。 苹果表示此前之所以使用Hey Siri,主要原因...
-
Gurman:未来只需说“Siri”就能唤醒苹果语音助手
语音识别2023-05-15 08:21 6051
IT之家 5 月 14 日消息,据彭博社记者马克古尔曼(Mark Gurman)报道,苹果公司正在对 Siri 进行重大改进,计划在未来几年内取消目前必须使用的嘿,Siri唤醒语音助手的方式。 古尔曼在最近一期的Power On通讯中称,苹果正在研究让 Siri 能够在使用单个词Siri...
-
微软NaturalSpeech 2来了,基于扩散模型的语音合成
语音识别2023-05-12 14:26 15078
文本到语音合成(Text to Speech,TTS)作为生成式人工智能(Generative AI 或 AIGC)的重要课题,在近年来取得了飞速发展。多年来,微软亚洲研究院机器学习组和微软 Azure 语音团队持续关注语音合成领域的研究与相关产品的研发。为了合成既自然又高质量的人...
-
仅3秒音频AI就能克隆完整语音,足以骗过银行和你的家人!
语音识别2023-03-12 09:04 8391
凭借一小段录音而完美复制整个人的口音,在今年之前肯定让人感觉这是科幻电影的情节,但在今年爆火的生成性人工智能GPT的背景下,使得无人不敢不信服。 今年,多家机构都研发了自己的AI。微软最近也推出了一个新的 AI,据说它 只需要你三秒钟的音频样本 即可...
-
专家利用AI生成的语音成功通过银行语音验证系统
语音识别2023-02-27 09:29 6843
IT之家 2 月 25 日消息,大多数美国和欧洲银行都提供了语音 ID 的登录方式, 不过最新安全专家表示可以使用人工智能(AI)生成的语音来欺骗银行的验证系统。 资深撰稿人约瑟夫考克斯(Joseph Cox)近日在 Vice 平台发布文章,分享了他如何利用 AI 生成的语音...
-
利润下降超60%,语音识别技术难成科大讯飞护城河
语音识别2023-02-04 10:27 7996
图片来源@视觉中国 文 | 锌财经,作者 | 路世明,编辑 | 大风 1月29日,科大讯飞发布公告称,预计2022年净利润4.67亿元-6.23亿元,同比下降60%-70%。 所谓的疫情和大环境,早已成为万能的背锅侠。虽然不可否疫情产生的影响,但抛开疫情也能发现,科大一揽子...
-
使用OpenAI的Whisper 模型进行语音识别
语音识别2023-01-28 12:24 10556
语音识别是人工智能中的一个领域,它允许计算机理解人类语音并将其转换为文本。该技术用于 Alexa 和各种聊天机器人应用程序等设备。而我们最常见的就是语音转录,语音转录可以语音转换为文字记录或字幕。 wav2vec2、Conformer 和 Hubert 等最先进模型的最新...
-
Meta推首款语音对语音翻译技术 让闽南语能直接变英语
语音识别2022-10-20 18:15 41584
【CNMO新闻】过去常见语言翻译系统,大多是建立在有实际语音及对应文字内容,并且通过交叉比对或深度学习方式进行翻译。而近日,Meta宣布推出全球第一款能直接以语音对语音方式进行翻译的技术。这一技术之强大,甚至能让原本没有实际对应标准书写文字内容的...
-
苹果、微软、谷歌、亚马逊、Meta 合作,将改善残疾人的语音识别
语音识别2022-10-04 08:54 14044
IT之家 10 月 3 日消息,美国伊利诺伊大学(UIUC)宣布与苹果、微软、谷歌、亚马逊、Meta 以及非营利组织合作,开展语音辅助功能项目,其目的是改善残疾人士的语音识别功能,以及 AI 算法未覆盖到的各种语音模式。 据介绍,该项目将帮助患有肌萎缩侧索硬化(...
热门排行
最新发布
- OpenAI ChatGPT 高级语音模式已登陆 Windows 和 Mac 平台
- 科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电
- GPT-4o模仿人声说“不”,无意的语音生成仍是模型弱点
- 语音克隆技术引发担忧,OpenAI 再次解释其文本转语音工具
- 智能座舱算法基础之语音识别篇
- 科大讯飞申请语音识别专利,提升实体词的识别效果
- 声音如何泄露你的隐私?美国学者谈智能语音的风险
- 苹果介绍语音辅助功能:可用 iPhone 保留自己的声音
- 高通公司申请使用语音认证的设备查找器专利,使得扬声器可听见地输出警报声音以协助用户定位计算设备
- 最强开源语音克隆AI模型:Coqui TTS
推荐内容
- 2024山东国际玻璃工业技术展览会
- 2024第二十二届中国广州国际汽车展览会
- 2024第104届中国(上海)电子展览会(中国电子展CEF)
- 2024阿尔及利亚国际建材展
- 2024第12届中国(青岛)国际茶产业博览会(华巨臣茶博会)
- 2024年阿尔及利亚国际暖通空调制冷展览会ALGERIA
- 2024第十二届慕尼黑上海分析生化展(labtech China Congress)
- 2024沙特国际生活用纸展、卫生用品、包装印刷工业展
- 2024第二届东莞国际紧固件弹簧及制造装备展览会
- 2024第七届欧洲(德国不来梅)国际空间技术展
- 2024年荷兰阿姆斯特丹船舶游艇设备展览会METS TRADE
- 2024第12届巴基斯坦(卡拉奇)国际防务与军警展
- 2024年俄罗斯莫斯科电力、电网技术展览会
- 2024(京津冀)水果产销对接会
- 2024第二十一届北方(烟台)国际果业博览会(北方果博会 NIFIE)
- 2024 第二十三届新加坡国际石油及天然气展览会暨研讨会
- 2024第十七届上海国际电池工业展览会(振威电池展 CNIBF)
- 2024第二十届上海国际充电设施产业展览会(振威充电设施展 evse)
- 2024第十六届中国(上海)振威国际化工装备博览会(CTEF)
- 2024第十一届浙江义乌国际智能装备博览会
- 2024第十三届杭州国际跨境电商交易博览会(跨交会 ICBE)
- 2024第89届全国药品交易会(药交会 PHARMCHINA)
- 2024中国健康营养博览会(秋季)(NHNE)
- 2024乌兹别克斯坦食品及包装展 UZ PROD &INTER PACK
- 日本第45届国际建筑建材与家居材料展
- 2024中国北京名酒节暨世界葡萄酒博览会
- 2024中国国际制造业数智化博览会
- 2024年土耳其温室农业展土耳其畜牧机械展GrowTech Eurasia
- IADE2024第三届突尼斯(杰尔巴)国际航空航天与防务展
- 2024年中国(北京)国际有机绿色食品展览会
- 2024年中国北京国际高端食品饮料博览会
云推荐
- 比亚迪价格战 越打越赚钱?
- 别克GL8陆尊PHEV上市72小时累计订单已突破10017台
- 能抓蒲公英的机器人,中国科大研发出“多孔磁性软体抓手”
- 文远知行正式登陆纳斯达克:全球通用自动驾驶第一股
- 2025年澳大利亚机械加工及激光设备展览会
- 华为杨超斌:5G-A 释放移动 AI 无限潜能
- 数据存储力量第六期:Solidigm正推动QLC在AI市场的应用
- 90后女航天员还是个“学霸” 拿国奖、省三好、保研成功
- 小吃创业,从这里起步——想创业做小吃,看这里!
- AI产品观察:以后不需要实习生做数据看板了—Graphy
- 百联ZX深夜派对high翻全场,尽情释放的二次元舞台
- 2023加盟项目指南:如何找到最适合你的项目?
- Galaxy AI获权威认可 三星Galaxy S24系列MWC上海斩获重量级奖项
- 2025第四届西安国防科技产业博览会7月18日开幕!
- 国货之光:ugee友基UE12系列数位屏斩获2023日本优良设计大奖
- 2025中国国际工业装备展览会-展位预订
- 大模型的苦,创业的AI科学家最懂
- 第二届全球数字体育产业论坛举办 亚电数智体育陈维力:在数字时代善用科技的力量
- 杭州发出全市首张快递专用电动三轮车实体号牌
- 估值近3000亿!马斯克的AI公司xAI谋划巨额融资
- 优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
- 2024第十七届中国在线分析仪器应用及发展国际论坛暨展览会
- 甲骨文数据 AI 论坛在北京举行,开启AI企业化之旅
- CIFFF2025中国家博会(广州)国际家具材料及设备博览会官网
- 展会预告 | RATIONAL莱欣诺亮相2024 FHC邀您感受#令人惊叹的效果
- 2024第十七届厦门国际美业博览会
- 2024年深圳量子信息技术展览会(高交会专区)
- 中部A股第一城,长沙如何赢商?
- iOS 18.1:三项苹果牌 AI 新功能 / 特性推动 CarPlay 智能化
- 苹果开放研究人员访问 Private Cloud Compute 云端模型
- 创业小本生意赚钱,选对项目是关键!
- 自动驾驶进入资本市场快车道:文远知行正式在纳斯达克上市
- WSA2024第十届新加坡国际劳保展
- 海信E8N Pro系列Mini LED电视开售 支持AI全维感知
- 并行科技启动算海计划共建超大单体智算集群
- 2024 中亚(哈萨克斯坦)照明及智慧城市展
- 吉利熊猫卡丁开售 将于5月9日正式上市
- 2024亚太新材料创新应用博览会(APAME2024)
- 2024款苹果Mac mini配置曝光:M4/M4 Pro芯片,最高64GB内存
- 从满足需求到超越期待,小熊电器何以成为年轻人心中所爱?
- OpenAI语音转录工具Whisper被曝重大缺陷:凭空生成大段虚假内容
- 大学生创业方案策划书:你的创业指南
- 惠普战66七代轻薄本锐龙版上架 提供14英寸和16英寸两个版本
- 赚麻了!阿里又拿下一个IPO
- 2024中国(广州)国际网印及数码印刷技术展览会 第37届中国国际网印及数字化印刷展/中国国际数码印花工业技术展 第37届亚太网印数码印花展 2024DS Printech China
- 游戏外包公司到底值不值得去?游戏外包公司一年能赚多少?
- OPPO K12手机开售 搭载自研超抗摔金刚石架构
- 入冬降温后如何护关节?健力多蓝氨糖五重骨营养为关节护航
- 口碑井喷的AI产品「百度文库」,做对了什么?
- 夯实AI技术底座 万兴科技23年研发投入增至4.03亿元