1. 概述
talkGPT4All是基于GPT4All的一个语音聊天程序,运行在本地CPU上,支持Linux,Mac和Windows。它利用OpenAI的Whisper模型将用户输入的语音转换为文本,再调用GPT4All的语言模型得到回答文本,最后利用文本转语音(TTS)的程序将回答文本朗读出来。
关于 talkGPT4All 1.0的介绍在这篇文章。
talkGPT4All 1.0的视频效果。
由于GPT4All一直在迭代,相比上一篇文章发布时(2023-04-10)已经有较大的更新,今天将GPT4All的一些更新同步到talkGPT4All,由于支持的模型和运行模式都有较大的变化,因此发布 talkGPT4All 2.0。
具体来说,2.0版本相比1.0有下面的更新。
首先是GPT4All框架支持的语言模型从1个增加到8个,并且可以一键切换模型。具体的模型是
- Vicuna-7B-1.1-q4_2
- Vicuna-7B-1.2-q4_2
- wizardLM-7B.q4_2
- GPT4All
- GPT4All-J
- GPT4All-J-v1.1
- GPT4All-J-v1.2
- GPT4All-J-v1.3
可以看到除了GPT4All系列的模型,这个框架也支持Vicuna和Wizard的模型了。更多模型因为证书和格式的问题,还在集成中。
根据GPT4All的文档,不同模型在benchmark上的结果:
![]()
可以看到GPT4All系列的模型的指标还是比较高的。
另一个重要更新是GPT4All发布了更成熟的Python包,可以直接通过pip 来安装,因此1.0中集成的不同平台不同的GPT4All二进制包也不需要了。集成PyPI包的好处多多,既可以查看源码学习内部的实现,又更方便定位问题(之前的二进制包没法调试内部代码),且保证了不同平台安装命令一致(之前不同平台二进制包不同)。
还有一个变化是GPT4All会自动按需下载模型,因此用户不需要手动下载和维护模型路径。同时将模型统一放置到https://gpt4all.io/models/ 目录下,测试国内模型下载速度也很快,大家玩起来也会更舒服。
核心的更新内容就这些,下面对talkGPT4All的安装和使用进行说明,后面有空会添加一些多个语言模型效果的对比视频。