如何用J*ascript实现语音识别?


J*aScript语音识别主要依靠Web Speech API的SpeechRecognition接口,需检测兼容性、处理权限与事件,适合网页实时转文字;不支持Safari,复杂需求需接入云服务或WebAssembly模型。

如何用javascript实现语音识别?

J*aScript 实现语音识别主要依靠浏览器原生的 Web Speech API,特别是其中的 SpeechRecognition 接口(目前为 Chrome、Edge 等基于 Chromium 的浏览器支持较好,Firefox 有部分支持但需手动启用,Safari 尚未支持)。它无需后端、不依赖第三方 SDK,适合网页端实时语音转文字场景。

检查浏览器兼容性并初始化识别器

不是所有浏览器都支持,使用前必须检测并优雅降级:

  • window.SpeechRecognition || window.webkitSpeechRecognition 判断是否可用
  • 若不可用,提示用户换浏览器或改用其他输入方式
  • 创建实例时建议用 new (window.SpeechRecognition || window.webkitSpeechRecognition)()
  • 设置关键属性:如 recognition.continuous = false(单次识别),recognition.interimResults = true(返回中间结果)

监听识别事件并处理文本结果

语音识别是异步事件驱动的,核心事件有:

  • onstart:麦克风开启,可更新 UI 状态(如显示“正在听…”)
  • onresult:收到识别结果,event.resultsSpeechRecognitionResultList,每项含多个 SpeechRecognitionAlternative
  • onend:识别结束(可能因超时、出错或用户停止),可在此自动重启识别(设 continuous = true 时需手动调用 recognition.start()
  • .onerror:捕获错误(如 no-speechabortednot-allowed),尤其注意权限被拒时要引导用户授权

示例提取最终文本:
const transcript = event.results[0][0].transcript;
const isFinal = event.results[0].isFinal;

请求麦克风权限与用户交互设计

首次调用 recognition.start() 会触发浏览器权限弹窗,但不能提前预判是否被拒绝:

Felo Felo

全球首款实现同声传译的AI翻译工具,利用先进的人工智能进行实时语音识别,实现快速、准确的翻译

Felo 160 查看详情 Felo

立即学习“J*a免费学习笔记(深入)”;

  • 避免自动启动识别,应由用户显式点击按钮触发(符合 Chrome 的 autoplay 和权限策略)
  • 按钮文案建议明确,如“点击说话”,并实时反馈状态(禁用中 / 正在听 / 识别中 / 完成)
  • 权限被拒后,onerror 中的 event.error === 'not-allowed' 可用于提示用户去地址栏手动开启麦克风
  • 移动端需注意:部分 Android 浏览器要求 HTTPS,且某些 WebView 完全不支持

基础可用代码片段(可直接测试)

复制到 HTML 文件中,在 Chrome 中打开即可运行:

<button id="speakBtn">点击说话</button><br><div id="output"></div><br><br><script><br>const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition;<br>if (!SpeechRecognition) {<br>  document.getElementById('speakBtn').disabled = true;<br>  document.getElementById('output').textContent = '您的浏览器不支持语音识别';<br>} else {<br>  const recognition = new SpeechRecognition();<br>  recognition.interimResults = true;<br>  recognition.lang = 'zh-CN'; // 设为中文<br><br>  recognition.onresult = (event) => {<br>    let interimTranscript = '';<br>    let finalTranscript = '';<br>    for (let i = 0; i < event.results.length; i++) {<br>      const transcript = event.results[i][0].transcript;<br>      if (event.results[i].isFinal) {<br>        finalTranscript += transcript;<br>      } else {<br>        interimTranscript += transcript;<br>      }<br>    }<br>    document.getElementById('output').innerHTML =<br>      `最终:${finalTranscript}<br>暂定:${interimTranscript}`;<br>  };<br><br>  document.getElementById('speakBtn').onclick = () => {<br>    recognition.start();<br>  };<br>}<br></script>

基本上就这些。不复杂但容易忽略权限、兼容性和用户体验细节。如需更稳定或支持离线/多语言/自定义词表,就得接入 WebAssembly 模型(如 Vosk)或调用云服务(阿里云智能语音、百度语音等),那就超出纯 JS 范畴了。

以上就是如何用J*ascript实现语音识别?的详细内容,更多请关注其它相关文章!


# 如何用  # 淘宝seo通俗解释  # 上海seo地址  # 嵩县网站推广哪家好  # 宠物托管营销和推广  # 南山区网站营销推广  # 湘西小型网站建设新报价  # 张家港网站优化推广软件  # ip营销 推广  # 合肥庐阳区建设局网站  # 上海网站推广选哪家好点  # 离线  # 单元测试  # 您的  # 可以实现  # 被拒  # javascript  # 不支持  # 如何实现  # 语音识别  # w  # 阿里云  # 后端  # safari  # 云服务  # edge  # 浏览器  # js  # android  # html  # java 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 《绝区零》2.3前瞻|直播|内容介绍  sublime如何撤销关闭的标签页_sublime重新打开已关闭文件技巧  《跳跳舞蹈》循环播放方法  谷歌浏览器如何查找和删除恶意软件 谷歌浏览器内置安全清理工具使用教程  Selenium自动化:利用键盘模拟解决复杂日期输入框输入问题  顺丰快递单号查询寄件人 顺丰寄件人查询入口  外媒评《燕云十六声》DIY载具新玩法:很像《塞尔达传说王国之泪》!  使用VS Code调试Python代码:从入门到精通  SQLAlchemy 2.0 与 Pydantic 模型类型安全集成指南  微星主板BIOS怎么调整内存时序_内存参数手动优化BIOS设置教程  uc浏览器官网网页版使用 uc浏览器官网免费在线首页  vivo手机视频通话美颜怎么设置_vivo视频通话美颜开启方法  Golang如何实现HTTP请求重试机制_Golang HTTP请求错误处理策略  告别繁琐SEO!如何使用SyliusSitemap插件自动化生成网站地图,提升搜索引擎排名  realme 10 Pro息屏方案_realme 10 Pro省电策略  跨语言测试实践:使用Python Selenium测试现有J*a Web项目  《浙里办》电子发票开具方法  Mac怎么关闭按键声音_Mac键盘打字音效设置  Vue 3中独立响应式实例的创建与应用  抖音作品被限流怎么办 抖音内容优化与流量恢复方法  江苏大剧院会员卡购买步骤  Python测试中模块导入路径解析的最佳实践  J*aScript调试技巧_性能分析与内存快照  mysql怎么查询数据_mysql基础查询语句使用教程  解决 Vue 3 组件未定义错误:理解 createApp 与根组件的正确使用  《偃武》甘宁技能详解  BunnyStream TUS视频上传指南:解决401认证错误与参数配置  微博网页版入口链接 微博网页版在线互动平台  POKI小游戏在线免费入口链接 POKI小游戏无下载秒玩玩  Dash应用中自定义HTML页面标题与网站图标(F*icon)的实用指南  @Team是什么?揭秘团队含义  AngularJS动态内容中DOM元素查找的时序问题及$timeout解决方案  LocoySpider如何批量采集电商商品_LocoySpider电商采集的模板应用  《梦想世界:长风问剑录》药师一图流分享  抖音小程序怎么开通?小程序开通条件是什么?  米侠浏览器插件无法启用怎么办 米侠浏览器扩展兼容性修复  基于 Flink 和 Kafka 实现高效流处理:连续查询与时间窗口  c++如何链接Boost库_c++准标准库的集成与使用  J*a实现任务清单管理_集合框架综合入门练手  Golang如何使用gRPC拦截器实现日志收集_Golang gRPC拦截器日志收集实践  《合金装备4》有望推出重制版!制作人发话了  Microsoft Edge网页字体太淡看不清怎么办_Microsoft Edge字体渲染优化技巧  AI图层蒙版怎么用_AI图层蒙版应用技巧与设计实例  《伊瑟》凶影追缉库卢鲁boss攻略  外卖小程序对接第三方配送  优酷官网登录入口电脑版 优酷官网网址入口  《下一站江湖2》独孤剑诀习得方法  如何使用CSS Grid实现“大方块左侧,小方块右侧垂直堆叠”的水平布局  小米手机屏幕失灵乱跳怎么办 屏幕触控问题自检与临时解决方法【应急】  追剧达人如何发弹幕 

 2025-12-17

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.