
비탈릭 부테린 최신 기사: 트위터의 커뮤니티 노트는 매우 암호정신적이며, 새로운 소셜 미디어 실험의 미래를 기대한다
작성: vitalik
번역: TechFlow
지난 2년간 트위터(X)는 상당히 격동의 시기를 겪어왔다. 작년, 일론 머스크가 이 플랫폼을 440억 달러에 인수한 후, 회사의 인력 구성, 콘텐츠 검토, 비즈니스 모델 및 사이트 문화 전반에 걸쳐 대대적인 개혁을 단행했다. 이러한 변화들은 특정 정책 결정이라기보다는 더 많은 경우 일론 머스크 본인의 소프트 파워에 기인한 것일 수 있다. 그러나 이런 논란이 많은 조치들 속에서도 트위터에서 새롭게 등장한 한 기능이 빠르게 중요성을 얻었으며, 정치적 입장과 관계없이 다양한 진영으로부터 호감을 받고 있다. 바로 커뮤니티 노트(Community Notes)이다.

커뮤니티 노트는 사실 확인 도구로, 위 일론 머스크의 트윗처럼 일부 트윗 아래에 배경 정보를 덧붙이는 방식으로 허위 정보 확산에 대응한다. 원래는 Birdwatch라는 이름으로 알려졌으며, 2021년 1월 처음으로 시범 프로젝트로 출시되었다. 이후 점진적으로 확대되었고, 특히 지난해 일론 머스크가 트위터를 인수한 시점과 함께 가장 빠른 성장세를 보였다. 오늘날 트위터에서 주목받는 트윗들, 특히 논란이 되는 정치적 주제에 관한 트윗에는 자주 커뮤니티 노트가 달린다. 내 개인적인 판단과 더불어 다양한 정치 진영 사람들과의 대화를 통해 알게 된 바에 따르면, 이 노트들이 등장할 때는 유익하고 가치 있는 정보를 제공하는 경향이 있다.
하지만 나에게 가장 흥미로운 점은, 커뮤니티 노트가 엄밀히 말해 "암호화 프로젝트"는 아니지만, 우리가 현실 세계에서 접할 수 있는 가장 암호화된 가치에 가까운 사례 중 하나라는 점이다. 커뮤니티 노트는 중앙에서 지정된 전문가들에 의해 작성되거나 선별되지 않는다. 누구나 작성하고 투표할 수 있으며, 어떤 노트가 표시될지는 완전히 오픈소스 알고리즘에 의해 결정된다. 트위터 웹사이트는 이 알고리즘이 어떻게 작동하는지 설명하는 상세하고 포괄적인 안내서를 제공하며, 게시된 노트와 투표 데이터를 다운로드하여 로컬에서 알고리즘을 실행하고, 그 출력 결과가 트위터 웹사이트에 나타나는 내용과 일치하는지를 직접 검증할 수도 있다. 완벽하진 않지만, 논란이 큰 상황에서도 믿을 수 있고 중립적인 이상에 의외로 근접하며 동시에 매우 유용하다.
커뮤니티 노트 알고리즘은 어떻게 작동할까?
일정 기준을 충족하는 트위터 계정(기본적으로 6개월 이상 활성화되어 있고, 규정 위반 기록이 없으며, 휴대폰 번호가 인증된 사용자)이라면 누구나 커뮤니티 노트에 참여할 수 있다. 현재로서는 참가자가 느리고 무작위적으로 승인되고 있지만, 궁극적으로는 조건을 충족하는 모든 사람이 가입할 수 있도록 하는 것이 목표다. 일단 승인되면, 먼저 기존 노트에 대한 평가에 참여할 수 있으며, 평가의 질이 충분히 좋다고 판단되면(평가 결과가 해당 노트의 최종 결과와 얼마나 잘 부합하는지로 측정됨) 자신만의 노트를 작성할 수 있게 된다.
노트를 작성하면, 다른 커뮤니티 노트 회원들의 평가를 받아 점수를 획득하게 된다. 이러한 평가는 “도움이 됨”, “약간 도움이 됨”, “도움이 안 됨”의 세 가지 수준으로 투표되는 것으로 볼 수 있으나, 평가에는 알고리즘에서 역할을 하는 추가 태그들도 포함될 수 있다. 이들 평가를 바탕으로 노트는 점수를 받으며, 점수가 0.40을 초과하면 해당 노트가 공개되고, 그렇지 않으면 표시되지 않는다.
알고리즘의 독특한 점은 점수 산정 방식에 있다. 단순히 사용자 평가의 합이나 평균을 계산해 최종 결과로 사용하는 간단한 알고리즘과 달리, 커뮤니티 노트 평가 알고리즘은 서로 다른 관점을 가진 사람들이 긍정적인 평가를 내리는 노트를 우선시하도록 설계되어 있다. 즉, 평소 평가에 의견이 분분했던 사람들이 특정 노트에서는 의견이 일치한다면, 그 노트는 높은 점수를 받게 된다.
이제 그 작동 원리를 좀 더 깊이 살펴보자. 우리는 일련의 사용자와 일련의 노트를 가지고 있다. 여기서 행렬 M을 만들 수 있는데, Mij는 i번째 사용자가 j번째 노트에 대해 어떻게 평가했는지를 나타낸다.

특정 노트에 대해 대부분의 사용자는 평가를 하지 않았기 때문에 행렬의 대부분은 0이 될 것이다. 하지만 문제되지 않는다. 알고리즘의 목적은 각 사용자와 노트에 대해 두 개의 통계값을 할당하는 네 개의 변수 모델을 만드는 것이다. 사용자에게는 '친화도(friendliness)'와 '편향(polarity)'을, 노트에는 '유용성(usefulness)'과 '편향(polarity)'을 할당한다. 이 모델은 다음 공식을 사용하여 행렬 값을 예측하려 한다.

여기서 나는 Birdwatch 논문에서 사용된 용어와 함께, 수학 개념 없이 변수의 의미를 직관적으로 이해할 수 있도록 내가 제안한 용어를 소개한다:
-
μ는 일반적으로 사용자들이 얼마나 높은 평가를 주는지를 나타내는 "공적 감정(public sentiment)" 파라미터이다.
-
iu는 사용자의 "친화도"로, 해당 사용자가 높은 평가를 줄 가능성을 나타낸다.
-
in은 노트의 "유용성"으로, 해당 노트가 높은 평가를 받을 가능성을 나타낸다. 이것이 우리가 관심을 갖는 변수다.
-
fu 또는 fn은 사용자 또는 노트의 "편향"으로, 정치적 극단의 주요 축상 위치를 의미한다. 실제로 음의 편향은 대략 "좌파", 양의 편향은 "우파"를 의미하지만, 이 극단 축은 사용자와 노트의 데이터 분석을 통해 도출된 것이며, 좌파와 우파 개념이 하드코딩된 것은 아니다.
이 알고리즘은 표준적인 그래디언트 디센트(gradient descent)라는 꽤 기본적인 머신러닝 모델을 사용하여 행렬 값을 최적으로 예측할 수 있는 변수들을 찾아낸다. 특정 노트에 할당된 유용성이 그 노트의 최종 점수가 된다. 만약 노트의 유용성이 +0.4 이상이라면, 그 노트는 표시된다.
여기서 핵심적인 아이디어는, "편향"이 특정 노트가 일부 사용자들에게는 좋아지고 다른 사용자들에게는 싫어지는 특성을 흡수하며, 반면 "유용성"은 모든 사용자들에게 좋아지는 특성만을 측정한다는 점이다. 따라서 유용성을 선택함으로써, 다양한 집단 간의 인정을 받는 노트를 식별하고, 한 집단에서는 환영받지만 다른 집단에서는 반발을 일으키는 노트는 제외할 수 있다.
위 내용은 알고리즘의 핵심 부분만을 설명한다. 실제로는 그 위에 여러 추가 메커니즘이 더해져 있다. 다행히도, 이들은 공개 문서에 설명되어 있다. 이러한 메커니즘에는 다음이 포함된다:
-
알고리즘은 여러 차례 반복 실행되며, 매번 실제 투표에 임의로 생성된 극단적인 "가짜 투표"를 일부 추가한다. 이는 각 노트에 대한 알고리즘의 실제 출력이 하나의 값 범위가 되며, 최종 결과는 그 범위에서 추출한 "하한 신뢰 구간"에 따라 결정되며, 이를 0.32의 임계값과 비교한다.
-
많은 사용자들(특히 노트의 편향과 유사한 편향을 가진 사용자들)이 특정 노트를 "도움이 안 됨"으로 평가하고 동일한 "태그"(예: "논쟁적이거나 편향된 언어", "출처가 노트를 뒷받침하지 않음")를 이유로 지정할 경우, 노트 게시에 필요한 유용성 임계값이 0.4에서 0.5로 증가한다. (작아 보이지만 실제로는 매우 중요하다.)
-
노트가 승인된 후에는, 그 유용성이 승인에 필요한 임계값보다 0.01 낮아져야 한다.
-
여러 모델을 사용해 더 많은 반복 실행을 수행하며, 때때로 원래 유용성 점수가 0.3~0.4 사이인 노트들을 강조하기도 한다.
결국, 22개 파일에 걸쳐 총 6282줄의 다소 복잡한 Python 코드가 만들어진다. 하지만 모든 것이 공개되어 있으며, 노트와 평가 데이터를 다운로드하여 직접 실행해보고, 그 출력 결과가 트위터 웹사이트의 실제 결과와 일치하는지 확인할 수 있다.
실제로는 어떻게 작동할까?
이 알고리즘이 단순히 사람들의 투표를 평균내는 방법과 가장 크게 다른 점은 아마도 내가 "편향"이라고 부르는 값의 개념일 것이다. 알고리즘 문서에서는 이를 fu와 fn이라고 부르며, f는 factor(요인)의 약자인데, 이 두 항이 서로 곱해지기 때문이다. 더 일반적인 용어를 사용한 것은 궁극적으로 fu와 fn을 다차원으로 만들고자 하기 때문이다.
편향은 사용자와 노트 모두에게 할당된다. 사용자 ID와 실제 트위터 계정 간의 연결은 고의로 비공개로 유지되지만, 노트 자체는 공개된다. 실제로 영어 데이터셋의 경우, 알고리즘이 생성한 편향은 좌우 진영과 매우 밀접하게 관련되어 있다.
다음은 편향이 약 -0.8인 노트들의 예시이다:

여기서 나는 굳이 선별한 것이 아님을 밝힌다. 이들은 내가 로컬에서 알고리즘을 실행했을 때 생성된 scored_notes.tsv 스프레드시트에서 편향 점수(coreNoteFactor1)가 -0.8 미만인 첫 세 줄이다.
이제 편향이 약 +0.8인 노트들 몇 가지를 살펴보자. 실제로 이들 중 상당수는 포르투갈어로 브라질 정치를 다루는 사람이나, 테슬라 비판에 분노하는 팬들이 작성한 것이어서, 두 범주에 속하지 않는 노트들을 약간 골라보겠다:

다시 한번 강조하지만, "좌파 vs 우파"의 구분은 알고리즘에 어떠한 방식으로도 하드코딩되지 않았다. 그것은 계산을 통해 발견된 것이다. 이는 이 알고리즘을 다른 문화적 맥락에 적용하면, 자동으로 그들의 주요 정치적 분열을 감지하고 그 분열 사이를 연결할 수 있음을 시사한다.
한편, 가장 높은 유용성 점수를 받은 노트들은 다음과 같다. 이번에는 실제로 트위터에 표시된 노트들이므로 직접 스크린샷을 찍을 수 있다:

또 다른 예시:

두 번째 노트는 더욱 직접적으로 고도로 당파적인 정치적 주제를 다루고 있지만, 명확하고 고품질이며 정보가 풍부한 노트이기 때문에 높은 점수를 받았다. 전반적으로 이 알고리즘은 효과적으로 작동하며, 코드를 실행하여 출력 결과를 검증하는 것도 가능한 것으로 보인다.
나는 이 알고리즘에 대해 어떻게 생각할까?
이 알고리즘을 분석할 때 나를 가장 인상 짓는 것은 그 복잡성이다. 그래디언트 디센트를 사용해 다섯 개의 벡터와 행렬 방정식의 최적 피팅을 찾는 "학술 논문 버전"이 있고, 실제 버전은 여러 차례 다른 실행을 포함하는 복잡한 알고리즘 시리즈이며, 그 과정에서 많은 임의의 계수가 존재한다.
학술 논문 버전조차도 내재된 복잡성을 숨기고 있다. 최적화되는 방정식은 음의 4차식인데(예측 공식에 fu*fn 항의 제곱이 있고, 비용 함수는 오차의 제곱을 측정하기 때문). 임의의 수의 변수에서 2차 방정식을 최적화하는 것은 거의 항상 유일한 해를 가지며, 비교적 간단한 선형 대수로 계산할 수 있지만, 많은 변수에서 4차 방정식을 최적화하는 것은 일반적으로 여러 해를 가지며, 따라서 여러 라운드의 그래디언트 디센트 알고리즘이 서로 다른 답을 도출할 수 있다. 작은 입력 변화만으로도 디센트가 한 국소 최솟값에서 다른 국소 최솟값으로 전환되어 출력 결과를 크게 바꿀 수 있다.
이것은 내가 참여하여 개발한 알고리즘(예: 2차 펀딩)과의 차이처럼 느껴지며, 마치 경제학자의 알고리즘과 엔지니어의 알고리즘의 차이 같다. 경제학자의 알고리즘은 이상적인 상황에서 단순성을 중시하며, 비교적 분석하기 쉬우며, 해결해야 할 과제에 대해 최적(또는 최악이 아닌)임을 보여주는 명확한 수학적 특성을 갖춘다. 이상적으로는 누군가 그것을 악용하려 할 때 얼마나 큰 피해를 입힐 수 있는지까지 증명할 수 있다. 반면 엔지니어의 알고리즘은 반복적인 시행착오를 통해 엔지니어의 운영 환경에서 무엇이 작동하고 무엇이 실패하는지를 보면서 도출된다. 엔지니어의 알고리즘은 실용적이며 일을 해낸다. 반면 경제학자의 알고리즘은 예상치 못한 상황에서 완전히 통제를 잃지 않는다.
또는 관련 주제에서 존경받는 인터넷 철학자 roon(aka tszzl)이 말했듯이:

물론 나는 암호화폐의 "이론적 미학(theoretical aesthetics)"이 필요하다고 말하겠다. 그것은 진정으로 신뢰 없이(trustless) 작동하는 프로토콜과, 겉보기에 좋아 보이고 표면적으로는 잘 작동하지만 실제로는 일부 중심화된 참여자를 신뢰해야 하거나, 더 나쁜 경우 완전한 사기일 수도 있는 것을 정확히 구분할 수 있기 때문이다.
딥러닝은 정상적인 상황에서는 잘 작동하지만, 다양한 적대적 머신러닝 공격에 대해 불가피한 취약점을 가진다. 기술적 함정과 고도로 추상화된 계단을 통해 이러한 공격에 대응할 수 있다면 더 좋을 것이다. 그래서 나는 질문을 던진다. 커뮤니티 노트 자체를 더 경제학적 알고리즘처럼 바꿔볼 수 없을까?
그것이 실제로 무엇을 의미하는지 이해하기 위해, 내가 몇 년 전 유사한 목적을 위해 설계한 알고리즘 하나를 살펴보자: Pairwise-bounded quadratic funding(쌍별 제한 2차 펀딩).

Pairwise-bounded quadratic funding의 목적은 "일반적인" 2차 펀딩의 한 취약점을 메우는 것이다. 즉, 두 명의 참여자가 서로 결탁하면 가짜 프로젝트에 매우 높은 금액을 기부하고, 자금을 다시 돌려받으며, 전체 기금 풀을 고갈시키는 큰 보조금을 얻을 수 있다는 점이다. 이 새로운 설계에서는 각 참여자 쌍(A, B)에게 제한된 예산 M을 할당한다. 알고리즘은 가능한 모든 참여자 쌍을 순회하면서, 참여자 A와 B가 모두 지지하는 프로젝트 P에 보조금을 추가하기로 결정하면, 그 보조금은 (A, B) 쌍에 할당된 예산에서 차감된다. 따라서 k명의 참여자가 결탁하더라도 기제로부터 훔칠 수 있는 금액은 최대 k*(k-1)*M에 불과하다.
이 형태의 알고리즘은 커뮤니티 노트 맥락에는 적합하지 않다. 각 사용자가 투표하는 횟수가 매우 적기 때문이다. 평균적으로 어떤 두 사용자 간의 공동 투표 수는 0이므로, 단순히 각 사용자 쌍을 개별적으로 보는 방식으로는 사용자의 편향을 파악할 수 없다. 머신러닝 모델의 목적은 바로 이렇게 매우 희소한 원본 데이터에서 행렬을 "채워넣는" 것이며, 그런 데이터는 직접적으로 분석하기 어렵다. 그러나 이러한 접근법의 어려움은 소수의 부정적인 투표 앞에서 결과가 극도로 불안정해지는 것을 방지하기 위해 추가적인 노력이 필요하다는 점이다.
커뮤니티 노트는 정말 좌우 극단에 저항할 수 있을까?
커뮤니티 노트 알고리즘이 실제로 극단에 저항하는지, 즉 단순한 투표 알고리즘보다 더 잘 작동하는지를 분석해볼 수 있다. 그런 투표 알고리즘은 어느 정도 극단에 저항한다. 200개의 좋아요와 100개의 싫어요를 받은 게시물은 좋아요만 200개 받은 게시물보다 성적이 나쁠 것이다. 하지만 커뮤니티 노트는 이것보다 더 잘할까?
추상적인 알고리즘만으로는 판단하기 어렵다. 평균 평가가 높지만 양극화된 게시물이 강한 편향과 높은 유용성을 가지지 못할 이유가 무엇인가? 아이디어는, 투표가 충돌할 경우 편향이 그 게시물을 좋아하게 만든 특성을 "흡수"해야 한다는 것이다. 하지만 실제로 그렇게 되고 있을까?
이를 확인하기 위해, 나는 스스로 간소화한 구현체를 100라운드 실행해보았다. 평균 결과는 다음과 같다:

이 테스트에서, "좋은" 노트는 같은 정치 진영 사용자들에게는 +2, 반대 진영 사용자들에게는 +0의 평가를 받으며, "좋지만 더 극단적인 경향"을 가진 노트는 같은 진영에는 +4, 반대 진영에는 -2의 평가를 받는다. 평균 점수는 같지만 편향은 다르다. 실제로 "좋은" 노트의 평균 유용성이 "좋지만 더 극단적인 경향"의 노트보다 더 높은 것으로 보인다.
더 "경제학자 알고리즘"에 가까운 알고리즘은 극단화를 어떻게 처벌하는지 더 명확한 이야기를 제공할 것이다.
높은 리스크 상황에서 이 모든 것이 얼마나 유용할까?
구체적인 사례를 통해 그 일부를 살펴볼 수 있다. 약 한 달 전, 이안 브레머(Ian Bremmer)는 중국 정부 관료의 트윗에 매우 비판적인 커뮤니티 노트가 달렸으나 그 노트가 삭제되었다고 불평했다.

메커니즘 디자인은 이더리움 커뮤니티 환경에서 하는 것과 다르다. 거기서는 최대 불만이 2만 달러가 극단적인 트위터 인플루언서에게 흘러가는 정도일 수 있다. 그러나 수백만 명의 삶에 영향을 미치는 정치 및 지정학적 문제를 다룰 때는 상황이 완전히 다르며, 사람들은 종종 최악의 동기를 가정하기 마련이다. 하지만 메커니즘 디자이너가 세상에 큰 영향을 미치고자 한다면, 이러한 고위험 환경과의 상호작용은 필수적이다.
트위터의 경우, 중심화된 조작이 노트 삭제의 원인이었다고 의심할 만한 명백한 이유가 있다. 일론 머스크는 중국에 많은 사업 이익을 가지고 있기 때문에, 커뮤니티 노트 팀에게 압력을 가해 알고리즘 출력을 조작하고 특정 노트를 삭제시켰을 가능성이 있다.
다행히도, 알고리즘은 오픈소스이며 검증 가능하다. 실제로 들여다볼 수 있다! 그러자. 원본 트윗의 URL은 https://twitter.com/MFA_China/status/1676157337109946369이다. 끝의 숫자 1676157337109946369는 트윗 ID다. 이 ID를 다운로드 가능한 데이터에서 검색하여 위 노트가 있는 스프레드시트의 특정 행을 확인할 수 있다:

여기서 우리는 노트 자체의 ID인 1676391378815709184을 얻는다. 그리고 이 ID를 알고리즘 실행으로 생성된 scored_notes.tsv 및 note_status_history.tsv 파일에서 검색한다. 다음과 같은 결과를 얻는다:


첫 번째 출력의 두 번째 열은 해당 노트의 현재 점수다. 두 번째 출력은 노트의 역사 기록을 보여준다. 현재 상태는 일곱 번째 열(NEEDS_MORE_RATINGS)이며, NEEDS_MORE_RATINGS가 아닌 첫 번째 이전 상태는 다섯 번째 열(CURRENTLY_RATED_HELPFUL)이다. 따라서 알고리즘 자체가 처음에 노트를 표시했다가, 점수가 약간 떨어진 후 제거했음을 알 수 있다. 중심화된 개입은 관련되지 않은 것으로 보인다.
투표 자체를 통해 또 다른 방식으로도 살펴볼 수 있다. ratings-00000.tsv 파일을 스캔하여 해당 노트에 대한 모든 평가를 분리하고, HELPFUL과 NOT_HELPFUL의 수를 확인할 수 있다:

하지만 시간순으로 정렬하여 처음 50개의 투표를 보면, HELPFUL이 40개, NOT_HELPFUL이 9개 있다. 따라서 우리는 동일한 결론에 도달한다. 노트의 초기 독자들은 긍정적으로 평가했지만, 이후 독자들은 평가를 더 낮췄기 때문에 점수는 처음에는 높았다가 시간이 지남에 따라 낮아졌다.
불행히도, 노트의 상태가 어떻게 변했는지에 대한 정확한 설명은 어렵다. 단순히 "이전에는 점수가 0.40 이상이었고 지금은 0.40 미만이므로 제거되었다"는 문제가 아니다. 오히려 많은 NOT_HELPFUL 응답이 비정상 조건 중 하나를 트리거하여, 노트가 임계값 이상을 유지하기 위해 필요한 유용성 점수를 증가시켰다.
이것은 또 다른 좋은 교훈을 준다. 신뢰할 수 있고 중립적인 알고리즘을 진정으로 신뢰 가능하게 만들기 위해서는 단순함을 유지해야 한다. 노트가 수용되었다가 수용되지 않게 되었다면, 왜 그런지에 대해 간단하고 명확한 설명이 있어야 한다.
물론 이 투표를 조작할 수 있는 또 다른 완전히 다른 방식도 있다: 브리게이딩(brigading). 자신이 동의하지 않는 노트를 본 사람이 높은 참여도를 가진 커뮤니티(혹은 더 나쁘게는 대량의 가짜 계정)를 동원하여 NOT_HELPFUL로 평가하도록 촉구할 수 있으며, 많은 투표 없이도 노트를 "도움됨"에서 "극단적"으로 바꾸는 데 충분할 수 있다. 이 알고리즘이 이러한 조정 공격에 취약한 정도를 올바르게 줄이기 위해서는 더 많은 분석과 노력이 필요하다. 가능한 개선책 중 하나는 모든 사용자가 모든 노트에 투표할 수 있도록 허용하지 않고, "당신을 위한 추천" 알고리즘을 사용하여 노트를 무작위로 평가자에게 할당하고, 평가자가 자신에게 할당된 노트에 대해서만 평가하도록 제한하는 것이다.
커뮤니티 노트는 너무 "비겁"한가?
내가 본 커뮤니티 노트에 대한 주요 비판은 기본적으로 그것이 충분히 행동하지 않는다는 것이다. 최근 이 점을 언급한 두 편의 글을 보았다. 그 중 한 편을 인용하자면:
이 프로그램은 커뮤니티 노트가 공개되기 위해선 다양한 정치 진영 사람들이 일반적으로 동의해야 한다는 심각한 제약을 받고 있다.
“이것은 이념적 합의가 필요합니다,”라고 그는 말했다. “좌익과 우익이 모두 그 주석이 그 트윗에 첨부되어야 한다는 데 동의해야 한다는 뜻입니다.”
그는 본질적으로 “진실에 대한 이념을 초월한 합의가 필요하다”고 말했다. “그리고 당파적 갈등이 심화되는 환경에서 그러한 합의를 이루는 것은 거의 불가능하다.”
이것은 골치 아픈 문제지만, 결국 나는 열 개의 잘못된 정보 트윗이 자유롭게 퍼지는 것을 허용하는 것이, 한 트윗에 부당하게 주석을 붙이는 것보다 낫다고 생각한다. 우리는 오랫동안 사실을 확인하려는, 용감한 노력들을 목격해왔다. “사실을 알고 있으며, 한쪽이 다른 쪽보다 더 자주 거짓말한다는 것을 알고 있다”는 관점에서 말이다. 결과는 어땠는가?

솔직히 말해, 사실 확인이라는 개념에 대한 불신이 상당히 보편적이다. 여기서 한 전략은 비판가들을 무시하고, 사실 확인 전문가들이 어떤 투표 시스템보다 사실을 더 잘 안다는 것을 기억하며 계속 나아가는 것이다. 그러나 이러한 접근 방식을 전면적으로 취하는 것은 위험해 보인다. 모든 사람에 의해 어느 정도 존중받는 초당파적 기관을 만드는 것은 가치 있는 일이다. 윌리엄 블랙스톤의 격언과 법원처럼, 나는 이러한 존중을 유지하기 위해서는 누락의 오류는 있어도 능동적인 오류는 없는 시스템이 필요하다고 생각한다. 따라서 적어도 한 주요 조직이 이러한 다른 길을 걷고, 드물게 발생하는 초당파적 존중을 소중한 자원으로 여기는 것은 가치 있는 일처럼 보인다.
커뮤니티 노트가 다소 보수적인 태도를 취하는 것이 괜찮다고 생각하는 또 다른 이유는, 모든 잘못된 정보 트윗, 혹은 대부분의 잘못된 정보 트윗이 정정 주석을 받아야 한다고 생각하지 않기 때문이다. 잘못된 정보 트윗 중 1%도 안 되는 것들이 배경이나 정정 정보를 제공하는 주석을 받더라도, 커뮤니티 노트는 여전히 매우 가치 있는 교육 도구로서 기능한다. 목표는 모든 것을 바로잡는 것이 아니라, 다양한 관점이 존재하며, 고립된 상태에서 보기에는 설득력 있고 매력적으로 보이는 게시물이 실제로는 상당히 잘못되었을 수 있다는 것을 사람들에게 상기시키는 것이다. 그리고 당신, 네, 너는 보통 기본적인 인터넷 검색만으로도 그것이 틀렸는지 확인할 수 있다는 것이다.
커뮤니티 노트는 공적 인식론의 모든 문제를 해결할 묘약이 될 수 없으며, 그렇게 될 의도도 없다. 그것이 해결하지 못하는 문제들에 대해서는, 예측 시장과 같은 새로운 장치이거나, 전문 지식을 가진 전임 직원을 고용하는 기존 조직들이 충분한 공간을 가지고 그 빈틈을 메울 수 있다.
결론
커뮤니티 노트는 흥미로운 소셜 미디어 실험일 뿐 아니라, 흥미로운 새로운 메커니즘 설계 유형의 사례이기도 하다. 극단을 의도적으로 식별하고, 분열을 연장하기보다는 초당파적 합의를 촉진하려는 메커니즘이다.
내가 아는 이 범주 내의 다른 두 가지 예시는: (i) Gitcoin Grants에서 사용되는 쌍별 2차 펀딩 메커니즘, 그리고 (ii) Polis이다. Polis는 클러스터링 알고리즘을 사용하여 일반적으로 환영받는 진술을 식별함으로써, 다양한 관점을 가진 사람들이 공감할 수 있도록 돕는 토론 도구이다. 이 메커니즘 설계 분야는 가치 있으며, 앞으로 이 분야에서 더 많은 학술 작업이 이루어지기를 기대한다.
커뮤니티 노트가 제공하는 알고리즘 투명성은 완전한 탈중앙화된 소셜 미디어는 아니다. 만약 당신이 커뮤니티 노트의 작동 방식에 동의하지 않는다면, 다른 알고리즘으로 동일한 콘텐츠를 보는 관점을 얻을 방법은 없다. 하지만 향후 몇 년 동안 초대규모 애플리케이션들이 달성할 수 있는 가장 근접한 형태이며, 이미 중앙집권적 조
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














