工作记录
Todo
TTS 发音功能 【doing】
TTS 能力:构建一个新的 TTS server, 使用 cached 非实时接口返回音频结果。
- tts-server 接口
tts生成接口:真正的 TTS 生成接口;给定 text, model, 生成音频【流式】 【这个接口先不做,直接做离线的脚本就行】- 支持模型:
- local-dajuan: 本地的模型 【done】
- 支持模型:
- tts-server 接口
Process
昨天算是把 QWEN3-TTS 环境搭建起来了,接下来就是看构建模型供 tts 调用了。 昨晚想了半天,觉得还是在 creator-tools 里构建好 fastapi 服务吧,一个是从终局出发,一个是不想在 tt-server 那边搞太多依赖—这装 qwen3-tts 得要大概 2G 的磁盘空间吧。
qwen3-tts server 完全是在 opencode (免费基模 bigpickle) 下做出来的。 我先把需求写好,然后先尝试用 codex, 但人证不成功,于是就切到了 opencode. 我就看它在那里写,给出一些评价。 还是会有些问题,比如在一个模块里写了函数结构但在另一边没用,async 里写了太多阻塞调用等。 但肯定还是比自己写要快的吧。
对于这种不在意 code 质量的东西,用 LLM 来写太划算了。不过它的直出方案不是最好的,最简单的—async 里调用 sync 重运算,显然会出问题的。 还是要有一定的经验去把控这种东西。
到晚上的时候,基本就搞完了。但是部署到服务器时,总是报 api-key 验证失败。搞了估计有 1 个小时,根据 LLM 来怀疑这怀疑那,最后把 server key 打出来,才发现用的是 dev — 环境变量是对的,进一步检查,原来是 import 错了。服了。
还是让 AI 来排错吧,自己排错有点不够耐心啊。
生活记录
给自行车轮胎充气,原来轮胎上写了 reco. pressure, min 2.5, max 4.5 bar. 结果我的才 1.x 了。细看也有裂纹了。好久了啊,9 年了。 一路辗转,北京-岳池又到了成都,希望能继续发挥作用吧。
下午去医院。走的时候还在吃饭,在和黄车车玩吃几口饭举高高的游戏,期间不注意状态了头上的吊灯,把我吓坏了。这玩意真的好危险,兴奋上来了,根本忘记了之前就记住的风险。 走的时候,她不让,简单安慰不好使,我还是直接走了,听到她哇哇哭。想起某个纪录片里也是有这个场景—可是人家爸爸是去工作去帮助别人,自己却是赶着去看病开药,未免有点无奈可悲吧。
昨晚好好发好了面粉,早上吃了包子,中午吃的烤饼,真好吃。
开完药,去了三圣花市。这个地方真有意思,它就是在高架桥下面做个一条长长的市场,能看到多向两条高速路间的缝隙,透出一线光亮。买花、逛的人还挺多的, 但花市好长,走到后面就基本没啥人了。 最后还是买的鲜切花—向日葵,盆栽后面再养吧。向日葵是因为之前看黄车车吃瓜子,跟她说向日葵,但想她应该不太清楚啥是向日葵,就买了这个。可是买回来她也不是非常感兴趣—也没有特意去展示吧。
情绪记录
Good
Bad
Reflect
中午联系了磊磊,明天家里见一面。朋友不多了,觉得不错的,还是多联系下吧。