谷歌开发出一种名为HeAR的生物声学模型可通过咳嗽、说话、呼吸检测疾病

by 小互
4月 ago

随着深度学习技术的进步，神经网络现在能够直接从原始语音数据中学习高质量的通用表示（representations），并将其应用于各种语义和非语义的语音相关任务。例如，通过分析语音中的非语义特征（如发音、共鸣等），可以检测和监控一些脑血管和神经退行性疾病（如中风、帕金森病、阿尔茨海默病等）。除此之外，源自呼吸系统气流的声音（如咳嗽声和呼吸模式）也可以用于健康监测。例如，医生可以通过识别类似百日咳的“呜”声或急性心血管事件中的喘息声来诊断相应的疾病。

谷歌的研究团队开发了一种名为 Health Acoustic Representations (HeAR) 的生物声学基础模型，该模型旨在通过分析人体的声音信号（如咳嗽、讲话和呼吸）来检测疾病。HeAR模型利用300万个音频数据训练而成，其中包括大约1亿个咳嗽声音，用于识别与健康相关的声学模式。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容，每天更新。

开通会员

Categories: AI 项目

Support authors and subscribe to content

加入会员

Related Content

INFP：基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话，谁在听

Gemini Teacher：基于 Gemini 2.0的英语口语练习助手 实时发音纠正和建议

Livekit推出一个开源的精准语音轮次检测模型 可精准识别用户是否说完话

微软开源了一款金融市场预测工具 MarS 能够实现逼真的市场模拟

MidJourney 推出个性化档案和情绪版新功能 记住你的风格喜好

INFP：基于音频驱动的双人对话中的互动头像生成能自动区分谁在说话，谁在听

Gemini Teacher：基于 Gemini 2.0的英语口语练习助手实时发音纠正和建议

Livekit推出一个开源的精准语音轮次检测模型可精准识别用户是否说完话

MidJourney 推出个性化档案和情绪版新功能记住你的风格喜好