
X 新算法開源,我們到底寫什麼內容才更吸引人?
TechFlow Selected深潮精選

X 新算法開源,我們到底寫什麼內容才更吸引人?
點贊幾乎不值錢,對話互動才是硬通貨。
作者:David,深潮 TechFlow
1 月 20 日下午,X 開源了新版推薦算法。
Musk 配的回覆挺有意思:「我們知道這算法很蠢,還需要大改,但至少你能看到我們在實時掙扎著改進。別的社交平臺不敢這麼幹。」

這話有兩層意思。一是承認算法有問題,二是拿「透明」當賣點。
這是 X 第二次開源算法。2023 年那版代碼三年沒更新,早就和實際系統脫節了。這次完全重寫,核心模型從傳統機器學習換成了 Grok transformer,官方說法是「徹底消除了手工特徵工程」。
翻譯成人話:以前的算法靠工程師手動調參數,現在讓 AI 直接看你的互動歷史來決定推不推你的內容。
對內容創作者來說,這意味著以前那套「幾點發帖最好」「帶什麼 tag 漲粉」的玄學可能不靈了。
我們也翻了翻開源的 Github 倉庫,在 AI 的輔助下,發現代碼裡確實藏著一些硬邏輯,值得扒一扒。
算法邏輯變化:從手工定義,到 AI 自動判斷
先說清楚新舊版本的區別,不然後面的討論容易混。
2023 年,推特開源的那版叫 Heavy Ranker,本質就是傳統機器學習。工程師要手動定義幾百個「特徵」:這條帖子有沒有圖、發帖人粉絲多少、發佈時間離現在多久、帖子裡有沒有鏈接...
然後給每個特徵配權重,調來調去,看哪個組合效果好。
這次開源的新版叫 Phoenix,架構完全不同,你可以理解成一個更加依賴 AI 大模型的算法,核心是用 Grok 的 transformer 模型,和 ChatGPT、Claude 用的是同一類技術。
官方 README 文檔裡寫得很直白:「We have eliminated every single hand-engineered feature。」
傳統那種靠手工提取內容特徵的規則,一個不剩,全砍了。
那現在,這個算法靠什麼判斷一個內容到底好不好?
答案是靠你的行為序列。你過去點贊過什麼、回覆過誰、在哪些帖子上停留超過兩分鐘、屏蔽過過哪類賬號。Phoenix 把這些行為餵給 transformer,讓模型自己學出規律並進行總結。

打個比方:舊算法像一張人工編寫的評分表,每項打勾算分;
新算法像一個看過你所有瀏覽記錄的 AI,直接猜你下一秒想看什麼。
對創作者來說,這意味著兩件事:
第一,以前那些「最佳發帖時間」「黃金標籤」之類的技巧,參考價值變低了。因為模型不再看這些固定特徵,它看的是每個用戶的個人偏好。
第二,你的內容能不能被推出去,越來越取決於「看到你內容的人會怎麼反應」。這個反應被量化成了 15 種行為預測,我們下一章細說。
算法在預測你的 15 種反應
Phoenix 拿到一條待推薦的帖子後,會預測當前用戶看到這條內容可能產生的 15 種行為:
- 正向行為:如點贊、回覆、轉發、引用轉發、點擊帖子、點擊作者主頁、看完一半以上視頻、展開圖片、分享、停留超過一定時長、關注作者
- 負向行為:如點「不感興趣」、Block 作者、Mute 作者、舉報
每種行為對應一個預測概率。比如模型判斷你有 60% 概率點贊這條帖子、5% 概率屏蔽這個作者等等。
然後算法做一件簡單的事:把這些概率乘以各自的權重,加起來,得到一個總分。

公式長這樣:
Final Score = Σ ( weight × P(action) )
正向行為的權重是正數,負向行為的權重是負數。
總分高的帖子排前面,低的沉下去。
跳出公式,其實說白了就是:
現在一個內容好不好,真的不由內容本身寫的好不好決定了(當然可讀性和利他性是傳播的基礎);而是更多的取決於「這條內容會讓你做出什麼反應」。算法不在乎帖子本身的質量,它只在乎你的行為。
按這個思路想,極端情況下一條低俗但讓人忍不住回覆吐槽的帖子,得分可能比一條優質但沒人互動的帖子更高。這套系統的底層邏輯或許就是如此。
不過,新開源版本的算法沒公開具體行為權重的數值,但 2023 年那版公開過。
舊版參考:一次舉報 = 738 次點贊
接下來我們可以扒一下 23 年的那組數據,雖然是舊的,但能幫你理解各種行為在算法眼裡的「價值」差多少。
2023 年 4 月 5 日,X 確實在 GitHub 上公開過一組權重數據。
直接上數字:

翻譯的再直白一些:

數據來源:舊版 GitHub twitter/the-algorithm-ml 倉庫,點擊可以查看原算法
幾個數字值得細看。
第一,點贊幾乎不值錢。 權重只有 0.5,是所有正向行為裡最低的。算法眼裡,一個點讚的價值約等於零。
第二,對話互動才是硬通貨。 「你回覆,作者又回覆你」的權重是 75,是點讚的 150 倍。算法最想看到的不是單向的贊,而是來回的對話。
第三,負向反饋代價極高。 一次 Block 或 Mute(-74)需要 148 次點贊才能抵消。一次舉報(-369)需要 738 次點贊。而且這些負分會累積到你的賬號信譽分裡,影響後續所有帖子的分發。
第四,視頻完播率權重低得離譜。 只有 0.005,幾乎可以忽略。這和抖音、TikTok 形成鮮明對比,那兩個平臺把完播率當核心指標。
官方在同一份文件裡也寫了:「The exact weights in the file can be adjusted at any time... Since then, we have periodically adjusted the weights to optimize for platform metrics.」
權重隨時可能調,而且確實調過。
新版本沒公開具體數值,但 README 裡寫的邏輯框架一樣:正向加分,負向扣分,加權求和。
具體數字可能變了,但量級關係大概率還在。你回覆別人的評論,比收到 100 個贊更有用。讓人想 Block 你,比沒人互動更糟糕。
知道這些後,我們創作者能做什麼
扒完推特的新舊算法代碼,結合來看,提煉幾條可操作的結論。
1.回覆你的評論者。 權重表裡「作者回複評論者」是最高分項(+75),比用戶單方面點贊高 150 倍。不是讓你去求評論,而是有人評論了就回。哪怕回一句「謝謝」,算法也會記一筆。
2.別讓人想划走。 一次 block 的負面影響需要 148 次點贊才能抵消。爭議內容確實容易引發互動,但如果互動方式是「這人煩死了,block」,你的賬號信譽分會持續受損,影響後續所有帖子的分發。爭議流量是雙刃劍,砍別人之前先砍自己。
3.外鏈放評論區。 算法不想把用戶導出站外。正文帶鏈接會被降權,這點 Musk 自己公開說過。想導流的話,正文寫內容,鏈接扔第一條評論。
4.別刷屏。 新版代碼裡有個 Author Diversity Scorer,作用是給同一作者連續出現的帖子降權。設計意圖是讓用戶的 feed 更多樣,副作用是你連發十條不如精發一條。
6.沒有「最佳發帖時間」了。 舊版算法有「發佈時間」這個人工特徵,新版說砍就砍了。Phoenix 只看用戶行為序列,不看帖子是幾點發的。那些「週二下午三點發帖效果最好」的攻略,參考價值越來越低。
以上是代碼層面能讀出來的東西。
還有一些加分減分項來自 X 的公開文檔,不在這次開源的倉庫裡:藍標認證有加成、全大寫會被降權、敏感內容觸發 80% 觸達率削減。這些規則沒開源,就不展開了。
總結來看,這次開源的東西挺實在。
完整的系統架構、候選內容的召回邏輯、排序打分的流程、各種過濾器的實現。代碼主要是 Rust 和 Python,結構清晰,README 寫得比很多商業項目都詳細。
但有幾樣關鍵的東西沒放出來。
1.權重參數沒公開。 代碼裡只寫了「正向行為加分,負向行為扣分」,具體點贊值多少分、block 扣多少分,沒說。2023 年那版至少把數字亮出來了,這次只給了公式框架。
2.模型權重沒公開。 Phoenix 用的是 Grok transformer,但模型本身的參數沒放。你能看到模型怎麼被調用,看不到模型內部怎麼算的。
3.訓練數據沒公開。 模型是用什麼數據訓出來的、用戶行為怎麼採樣、正負樣本怎麼構造,都沒說。
打個比方,這次開源相當於告訴你「我們用加權求和算總分」,但沒告訴你權重是多少;告訴你「我們用 transformer 預測行為概率」,但沒告訴你 transformer 裡面長什麼樣。
橫向比較的話,TikTok 和 Instagram 連這些都沒公開過。X 這次開源的信息量,確實比其他主流平臺多。只是離「完全透明」還有距離。
這不是說開源沒有價值。對創作者和研究者來說,能看到代碼總比看不到強。
歡迎加入深潮 TechFlow 官方社群
Telegram 訂閱群:https://t.me/TechFlowDaily
Twitter 官方帳號:https://x.com/TechFlowPost
Twitter 英文帳號:https://x.com/BlockFlow_News














