工作记录

Todo

  • TTS 发音功能 【doing】

    TTS 能力:构建一个新的 TTS server, 使用 cached 非实时接口返回音频结果。

    • tts-server 接口
      • tts 生成接口:真正的 TTS 生成接口;给定 text, model, 生成音频【流式】 【这个接口先不做,直接做离线的脚本就行】
        • 支持模型:
          • local-dajuan: 本地的模型

    TTS-server 服务部署: 【done】

    • github workflow [done] => 总算跑起来了,各种问题:env-init 写 systemd 没有转义;新写的 GunicornSyslogLogger 问题;sqlite 文件夹不存在导致服务卡死的问题…

Process

TODO: 还是不能用 uv 来启动 gunicorn => 因为要接受 kill -KUP 的命令呢,uv 套一层就不对了! 【done】

又是折腾的一天。

  1. 发现 github cli 工具,提 pr + merge,比在网页上搞效率高太多了。
  2. 发现 fastapi + sqlite, 如果一开始 db dir 没有建起来,服务就起不来,而且不报错,就是卡在那里。实在诡异,不知道是不是哪里写错了。
  3. 安装 qwen3-tts,里面的 flash-attn 搞了半天:下载预编译的 wheel 各种不对,刚开始选择降低 python + torch 的版本,发现 cxxabi 总是不对,找不到符号;最后孤注一掷,直接用 python 3.14, torch 2.10, 最关键的:先装 flash-atten wheel, 再去自己装 torch. 这么搞,想不到真的可以了。不知道是因为新版本的因素,还是因为先装 wheel 再自动装依赖导致的。不过这个思路才是对的,降低版本,不对!
  4. 装好,发现 flash-atten 对我这老显卡支持不了啊—主要不支持硬件加速 bfloat16, 但是换成 float16 又会出错;只能说 bfloat16 能跑,开启 flash-atten 也能跑,不开也行—不开,岂不是白搞了?也不算吧,实践一下才知道具体如何。

生活记录

中午好好煮的水煮肉片+豆腐白菜,好好吃;

晚上黄车车睡觉,还是陪了一个多小时,换好好。哈哈,真的就这样了。

和黄车车完成了一个交换—她吃几口饭,就举高高几下。结果是多吃了一点,但是晚上还是喝了 2 罐奶。不知道是真的没吃饱,还是心理因素。


情绪记录

Good

Bad


Reflect

股票大跌,但自己仓库又补完了。局势朝着越发扩大的趋势在走了。

这个时代,会不会开启一段越发动乱的时光呢?如果后面战火纷飞,自己这辈子,活够了吗?该享受的享受到了吗?

想想,好像也还差不多吧,哈哈。

今天继续没有读书,雪球+东财轮着刷。