语音识别 语音合成 语音唤醒 语音降噪 回声消除 语音分离 音频分类 说话人确认 说话人日志 标点预测 时间戳预测 语音端点检测 困惑度计算 语音语种识别 音频量化编码 音视频语音识别 情绪识别 逆文本正则化 多模态 图像描述 视频描述 视觉定位 文本生成图片 文本生成视频 多模态表征 视觉问答 视频问答 图文检索 视觉蕴含 生成式多模态表征 多模态相似度 文档理解 视频时序定位 生成模型调优 多模态对话 计算机视觉 视觉分割 视觉检测跟踪 光学字符识别 人脸人体 视觉分类 视觉编辑 自然语言处理 文本分类 文本生成 分词 命名实体识别 翻译 文本摘要 句子相似度 预训练 自然语言推理 文本纠错 文本向量 特征抽取 情感分析 关系抽取 零样本分类 表格问答 问答 词性标注 实体分类 序列标注 任务型对话 语义相关性 FAQ问答 文本分割 端到端文本生成 抽取式摘要 翻译质量评估 通用信息抽取 聊天机器人 孪生通用信息抽取
硕博团队、专业指导、问题答疑