输入一张照片,和文字,就可以得到一个播报该文字的数字人

也可以结合下面的流,克隆声音,这样就能得到一个“声音” “文字” “形象” 都高度自定义的数字人了

https://runninghub.cn/#/workflow/1837084301916794881