Flow Schmidt
-
【討論貼】「路德社思維模型」開發 × 修復 × 優化 × 迭代專區
@Friedrich @Nuomt @ErwinSanchez
为什么这里要用 DeepSeek 的模型来训练?open ai 也有開源模型,為什麼不是這個?有没有替代方案?比如AWS / Google Cloud / Hugging Face Hub或者…
friedrich -
-
【討論貼】「路德社思維模型」開發 × 修復 × 優化 × 迭代專區
@antoniozeng1 Antonio 你好!以上补充对我很有启发。我觉得你提出的 1.3 – 1.7 放在元模型层更合适?我再想想。
@satoshi Satoshi 你好!我也觉得这个需要开个 GitHub repo (以及 HuggingFace),我认可 Antonio 的看法,如果路德社官方账号愿意开设 repo 的话最好。如果官方不开的话,我就自己开一个,然后分享到这里。
我个人对路德社思维模型的构想是 [10^4 token 以内的系统提示 + 必要的知识库] 的模式,该阶段不涉及模型微调任务,这么做的好处是它可以让任意(30B或以上的)大模型掌握路德社思维模型。当然,如果为推理阶段的 CoT 专门训练,效果应该会更好。
-
-
【討論貼】「路德社思維模型」開發 × 修復 × 優化 × 迭代專區
补充:“路德思维模型”版本 V1.0 的原帖见 信息技術研習社,原帖包含了提示词的构建逻辑、使用方式等。感谢 @ErwinSanchez 专门开设本专区进行提示词的迭代工作。后续贡献者请把用户名添加在提示词的相应位置。
各模塊(政治、經濟、軍事、信息戰等)如何協同?
我认为,这几个模块都属于叙事层 (Layer 3)。叙事层的构建应当包含:高信息密度的流畅逻辑叙述 + 针对已发生的重大事件的前因后果举例。叙事层其实是需要像调用工具一样,调用上一个元模型层的各种元模型的(但是当前并没有很好地指出各元模型的应用)。当前的版本有很大的优化空间。
元模型层 (Layer 2) 的构建当前也是非常粗略的,每个元模型的功能、思维方式和应用举例并没有很好地交代。
对于事实层 (Layer 4),我认为用…
-
-
-
本帖主要讨论【路德社思维模型】的提示词构建。
我认为“路德社思维模型”这个概念是对路德社节目的不错的提炼。由于路德社的逻辑是前后连贯的,并且路德社对于国际地缘政治的叙事是始终如一的,这就为提炼路德社思维模型奠定了非常好的基础。在路德时评节目中,有观众分享了使用 ChatGPT 构建路德社思维模型的案例,我受其启发,实现了能够让任意大语言模型掌握(或者说一定程度上掌握)路德社思维模型的方法(包括国内的开源模型)。
在继续讨论思维模型之前,我想先对 AI 领域的一些专有名词做一些澄清,作为对路德社节目的补充。
- 学习(或“训练”)。在 AI 领域,人们经常使用“学习”这个词,比如“让算法学一下”、“交给 AI…
-
老哥,这个真的可以嘛,我试试。👏🧐
- View 2 replies
-
佩服!啊!真受用!
👏👍
-
我问一个小问题,你们二人如此透彻地研究、琢磨、开发“路德社思维模型”,目的是什么?另外,更小的问题,你们二人都坐在中共国吧?
-
-
刚设置好论坛的账号,非常高兴能够加入这里。我与 @antoniozeng1 算半个同行吧,我也从事与量子信息相关的工作。刚看了一下 @antoniozeng1 的贴子,信息量有点爆炸,而且也有点超出我的脑容量了(原谅我理论物理真的不太行),希望之后能多交流学习。
-