Power Laws, Weblogs, and Inequality

Cat: ICT

Clay Shirky

Feb. 2003

  • I met Mr. Clay Shirky at the P2P Conference held in Washington DC in Nov. 2002, who talked as one of main panelists.
  • 2002年11月に、Washington DCで開催されたP2P Conferenceで、Mr. Clay Shirkyが主要なパネリストの一人として語るのに出会った。
0. Diversity creates inequality:

  • a small set of webloggers who account for a majority of the traffic in the weblog world. This complaint follows a common pattern we've seen with MUDs, BBSes, and online communities like Echo and the WELL.
    • As the new system grows, problems of scale set in. Not everyone can participate in every conversation. Some core group seems more connected than the rest of us, and so on.
  • Diversity plus freedom of choice creates inequality, and the greater the diversity, the more extreme the inequality.
  • In systems where many people are free to choose between many options, a small subset of the whole will get a disproportionate amount of traffic (or attention, or income), even if no members of the system actively work towards such an outcome.
    • This has nothing to do with moral weakness, selling out, or any other psychological explanation. The very act of choosing, spread widely enough and freely enough, creates a power law distribution.
    • Power law distributions, the shape that has spawned a number of catch-phrases like the 80/20 Rule and the Winner-Take-All Society, are finally being understood clearly enough to be useful.


  • ウェブロッグの世界の書き込みにおいては、少数のウェブロッグ書き込みが多数のトラフィックを占める傾向がある。この傾向は、MUD (Multiple User Dimension, Dungeon, or Dialogue) や掲示板やEcho、WELLといったオンライン・コミュニケーションで共通の不満でもある。
    • 新たなシステムが成長するのに伴い、スケールの問題が発生する。誰もが各々の会話に参加できないのである。一部の中心的なグループが他に比べてより多くの接続を行うというのである。
  • 多様性と選択の自由は不平等性を生み出し、その多様性が大きいほど不平等性も極端になる。
  • 大衆にとって多くの選択肢の中から自由に選べるシステムでは、全体のごく一部分が不釣り合いなほどのトラフィック (注目や収入など) を得る。たとえそのシステムの会員が積極的にそのような結果を働きかけなくてもである。
    • これはモラルの弱さや裏切りやその他の心理的な理由とは全く関係がない。選択するという行為自体が広範にかつ自由に行われる結果、ベキ法則分布ができあがるのである。
    • ベキ法則分布とは、よく言われるように、80/20の法則とか勝者の独り占めのような状態を生じる形であり、昨今は十分有効なものであると理解されてきた。

1. Predictable imbalance:

  • The economist Vilfredo Pareto observed that wealth follows a "predictable imbalance", with 20% of the population holding 80% of the wealth.
    • The linguist George Zipf observed that word frequency falls in a power law pattern, with a small number of high frequency words (I, of, the), a moderate number of common words (book, cat cup), and a huge number of low frequency words (peripatetic, hypognathous).
    • Jacob Nielsen observed power law distributions in web site page views, and so on.
  • We are all so used to bell curve distributions that power law distributions can seem odd.
    • Eg-1: <Figure-1> Shirkyfigure1
      433 blogs ranked by number of inbound links, is roughly a power law distribution. The top dozen (less than 3% of the total) accounted for 20% of the inbound links, and the top 50 blogs (not quite 12%) accounted for 50% of such links.
    • EG-2: All mailing lists in the Yahoo Groups Television category, ranked by number of subscribers.
  • The basic shape is simple - in any system sorted by rank, the value for the Nth position will be 1/N. For whatever is being ranked -- income, links, traffic -- the value of second place will be half that of first place, and tenth place will be one-tenth of first place.


  • Vilfredo Paretoは、富が不平等に分布することを見つけた。即ち、人口の20%が富の80%を所有しているのである。
    • 言語学者のGeorge Ziphは、単語の頻度がベキ法則に従うことを見つけた。即ち、ごく少数の高頻度の単語 (I, of, the)、中程度の数の普通の単語 (book, cat, cup)と低頻度でしか使用されない圧倒的多くの単語 (perigatetic巡回の, hypognathous小下顎症の) から成る。
    • Jacob Nielsenはウェブサイトの検索などにおいてベキ法則分布が生じることを見つけた。
  • 我々は釣り鐘曲線分布に慣れているので、ベキ法則分布は奇妙に見える。
    • 例1:<図1>
      インバウンド・リンクの数での433のブロッグを並べるとほぼベキ法則分布となる。上位12 (全体の3%未満)はインバウンド・リンクの20%を占め、上位50 (全体の12%未満)が50%を占める。
    • 例2: Yahooグループのテレビ・カテゴリーにおける全メーリングリストを購読者数の順に並べる場合。
  • 基本的な形は単純である。どのシステムでも順に並べると、N番目の値は1/Nになる。収入、リンク、トラフィックなどは、2番目の値は1番目の半分であり、10番目の値は1番目の1/10となる。

2. Breakthroughs in network theory:

  • Now, thanks to a series of breakthroughs in network theory by researchers like Albert-Laszlo Barabasi, Duncan Watts, and Bernardo Huberman among others, breakthroughs being described in books like Linked, Six Degrees, and The Laws of the Web, we know that power law distributions tend to arise in social systems where many people express their preferences among many options.
    • We also know that as the number of options rise, the curve becomes more extreme. This is a counter-intuitive finding - most of us would expect a rising number of choices to flatten the curve, but in fact, increasing the size of the system increases the gap between the #1 spot and the median spot.
  • A second counter-intuitive aspect of power laws is that most elements in a power law system are below average, because the curve is so heavily weighted towards the top performers.
    • In Figure #1, the average number of inbound links (cumulative links divided by the number of blogs) is 31. The first blog below 31 links is 142nd on the list, meaning two-thirds of the listed blogs have a below average number of inbound links.
  • We are so used to the evenness of the bell curve, where the median position has the average value, that the idea of two-thirds of a population being below average sounds strange. (The actual median, 217th of 433, has only 15 inbound links.)
  • Freedom of Choice Makes Stars Inevitable :
    To see how freedom of choice could create such unequal distributions, consider a hypothetical population of a thousand people, each picking their 10 favorite blogs. One way to model such a system is simply to assume that each person has an equal chance of liking each blog. This distribution would be basically flat - most blogs will have the same number of people listing it as a favorite.
    • A few blogs will be more popular than average and a few less, of course, but that will be statistical noise. The bulk of the blogs will be of average popularity, and the highs and lows will not be too far different from this average. In this model, neither the quality of the writing nor other people's choices have any effect; there are no shared tastes, no preferred genres, no effects from marketing or recommendations from friends.
    • But people's choices do affect one another. If we assume that any blog chosen by one user is more likely, by even a fractional amount, to be chosen by another user, the system changes dramatically.
    • Alice, the first user, chooses her blogs unaffected by anyone else, but Bob has a slightly higher chance of liking Alice's blogs than the others. When Bob is done, any blog that both he and Alice like has a higher chance of being picked by Carmen, and so on, with a small number of blogs becoming increasingly likely to be chosen in the future because they were chosen in the past.
  • Note that this model is absolutely mute as to why one blog might be preferred over another. Perhaps some writing is simply better than average (a preference for quality), perhaps people want the recommendations of others (a preference for marketing), perhaps there is value in reading the same blogs as your friends (a preference for "solidarity goods").
  • What matters is that any tendency towards agreement in diverse and free systems, however small and for whatever reason, can create power law distributions.


  • Albert-Laszlo Barabasi, Duncan Watts, Bernardo Hubermanなどの研究者によって、とりわけ、Linked, Six Degrees,あるいはThe Laws of the Webといった著作によって新たなネットワーク理論が発見された。その結果、多くの人々による多くの選択肢における選好の結果、社会システムにおいてベキ法則分布が表れることを認識できるようになった。
    • さらに選択肢が増えるほど曲線が極端になることがわかった。これは直感に反する結論である。我々の多くは、選択肢が増えれば曲線は緩慢になると思っていたが、実際にはシステムのサイズが大きくなると、その1位と中央の位置の値の差は大きくなる。
  • ベキ法則の第二に非直感的な面は、ベキ法則システムにおけるほとんどの要素は平均以下であるということである。それは曲線が極端にトップによって重みがつけられているからである。
    • 前図1で、インバウンド・リンクの平均 (累積のリンクをブロッグ数で割った) は31である。この31の直ぐ下のブロッグはリストの142番目である。これはリストの2/3はインバウンドリンクの平均よりも下位にあることを示している。
  • 我々は釣り鐘曲線における均一に慣れすぎている。それは中央値は平均であり、人口の2/3は平均以下であるという考えは尋常でないと思われるからである。 (実際の中央値は433中217番目であり、インバウンド・リンク数は15しかない。)
  • 選択の自由は必然的にスターを生む:
    • 一部のブロッグが平均より若干人気があるか、あるいはないかは統計上の誤差となる。大半のブロッグの人気度は平均しておりその上下の差は平均から大きくかけ離れてはいない。このモデルでは、書き込みの質や他人の選好などは影響しない。共通の好みの、人気のジャンルも、マーケティングや友人による推奨なども効果がない。
    • しかし人々の選好は相互に影響する。もしあるブロッグが1ユーザによってより多く好まれたと想定すると、そのシステムは劇的に変化する。
    • 最初のユーザAは誰の影響も受けずにブロッグを選ぶが、次のユーザBにとってはAのブロッグを選択する確率は、他よりほんの少しだけ高くなる。そうなると次のCはAとBが選んだブロッグを選ぶ確率はさらに高くなる。このようにして、ブロッグ間での過去の選択確率の少しの差によって、未来の選択確率が増加するのである。
  • このモデルでは、なぜあるブロッグは他よりも好まれたかについては何も語っていない。おそらくある書き込みが平均よりも単に優れていたのかも知れない (品質に対する選好)、あるいは他人による推奨かも知れない (マーケティングによる選好)、あるいは友人と同じブロッグを読むことの価値 (連帯商品による選好)
  • 重要なことは、多様かつ自由なシステムという前提があれば、選好の差がどれほど小さくても、あるいはどんな理由であっても、ベキ法則分布を生じるのである。

3. Inequality and Faireness:

  • Given the ubiquity of power law distributions, asking whether there is inequality in the weblog world (or indeed almost any social system) is the wrong question, since the answer will always be yes. The question to ask is "Is the inequality fair?" Four things suggest that the current inequality is mostly fair.
    1. The first, of course, is the freedom in the weblog world in general. It costs nothing to launch a weblog, and there is no vetting process
    2. The second is that blogging is a daily activity. They would disappear if they stopped writing, or even cut back significantly.
    3. Third, the stars exist not because of some cliquish preference for one another, but because of the preference of hundreds of others pointing to them. Their popularity is a result of the kind of distributed approval it would be hard to fake.
    4. Finally, there is no real A-list, because there is no discontinuity.


  • ベキ法則分布が一般的であるとすると、ウェブロッグ (あるいはほとんどどの社会システムでも) の世界には不平等が存在するのかという質問は愚問である。なぜならその答えはイエスであるからである。尋ねるべき質問は「この不平等は公平か」という質問であるべきである。現在の不平等性は多くの点で公平であるということに関して以下4点を示唆的である。
    1. 第一には、当然ながら、ウェブロッグの世界には自由がある。ウェブロッグを立ち上げるのに超すとはかからないし、審査も必要ない。
    2. 第二には、ブロッギングは毎日の行動である。書き込むことをやめたり、かなり少なくするだけで、ブロッグは消えていくだけである。
    3. 第三に、スターは、相互に排他的な選好によって存在するのではなく、何百という他人が選好によって指示することで成り立つのである。その人気は分散的な承認の結果のようなもので、やらせでそうすることは不可能である。
    4. 最後に、大物リストは存在しない。それは不連続な切れ目がないことによる。

4. Conversational mode of blogs:

  • Though there are more new bloggers and more new readers every day, most of the new readers are adding to the traffic of the top few blogs, while most new blogs are getting below average traffic, a gap that will grow as the weblog world does.
  • At the head will be webloggers who join the mainstream media. The transformation here is simple - as a blogger's audience grows large, more people read her work than she can possibly read, she can't link to everyone who wants her attention, and she can't answer all her incoming mail or follow up to the comments on her site.
    • The result of these pressures is that she becomes a broadcast outlet, distributing material without participating in conversations about it.
  • Meanwhile, the long tail of weblogs with few readers will become conversational. In a world where most bloggers get below average traffic, audience size can't be the only metric for success. LiveJournal had this figured out years ago, by assuming that people would be writing for their friends, rather than some impersonal audience.
    • Publishing an essay and having 3 random people read it is a recipe for disappointment, but publishing an account of your Saturday night and having your 3 closest friends read it feels like a conversation, especially if they follow up with their own accounts. LiveJournal* has an edge on most other blogging platforms because it can keep far better track of friend and group relationships, but the rise of general blog tools like Trackback** may enable this conversational mode for most blogs.
    • *Cf: "LiveJournal.com":
      LiveJournal is a simple-to-use personal publishing (=blogging) tool, built on open source software.
    • **Cf: "TrackBack":
      TrackBack is desgined to provide a method of notification between websites; it is a method of person A saying to person B, "This is something yo may be interested in." To do that, A sends a TracBack.ping to B.
  • In between blogs-as-mainstream-media and blogs-as-dinner-conversation will be Blogging Classic, blogs published by one or a few people, for a moderately-sized audience, with whom the authors have a relatively engaged relationship.
    • Because of the continuing growth of the weblog world, more blogs in the future will follow this pattern than today.
    • However, these blogs will be in the minority for both traffic and overall number of blogs.
  • Inequality occurs in large and unconstrained social systems for the same reasons stop-and-go traffic occurs on busy roads, not because it is anyone's goal, but because it is a reliable property that emerges from the normal functioning of the system.
  • The relatively egalitarian distribution of readers in the early years had nothing to do with the nature of weblogs or webloggers. There just weren't enough blogs to have really unequal distributions. Now there are.


  • 毎日、新たなブロッガーと新たな読者が登場するだろうが、その新たな読者は上位の少数のブロッグのトラフィックに加わることになろう。一方、ほとんどのブロッグは平均以下のトラフィックしか集まれない。こうしてブロッグの世界の進展に伴い、ギャップは開いていく。
  • 上位のブロッグに参加する人々はメインストリームのメディアへの参加者となる。その変化は単純である。ブロッガーの聴衆がが大きくなるにつれて、さらに多くの人々が彼女の作品を想定した読者以上が読むようになるので、彼女は入ってくるメールに答えることも、彼女のサイトへのコメントに対応することも不可能になる。
    • これらの圧力の結果、彼女は放送のような状態になる。それに関する会話に参加することもできずに単に素材を配布するだけとなるのだ。
  • 一方、下位のブロッグは、少数の読者との会話が可能になる。ほとんどのブロッガーは平均以下のトラフィックしかないので、聴衆のサイズが成功の基準ではなくなる。LiveJournalは、人々は、不特定の聴衆のためでなく、自分の友達のために物書きをするのであるということをもう何年も前に指摘している。
    • エッセイを出版した結果、まったくばらばらな読者が3人しかいないというのでは、それは落胆そのものである。だが、例えば、土曜の夜にあなたが物書きをして、あなたの親しい3人の友人がそれを読むとなると、それは会話のようなものになる。とくに自分の報告をつづる場合はなおさらである。LiveJournal*は、ブロッグのプラットフォームとして特に優れている。それは友人やグループ関係をうまくトラックできるからである。但しTrackback**のような一般的なブロッグ・ツールの登場によって、多くのブロッグでの会話モードが可能になってきた。
    • *注: "LiveJournal.com"参照:
      LiveJournalは、使用の簡単な個人出版 (ブロッギング)のツールで、オープンソースソフトウェアである。
    • **注:"トラックバック":
  • 主流メディアとしてのブロッグと夕食での会話のようなブロッグの中間形態は、一人ないし数人で好評される古典的なブロッグであり、中程度の規模の聴衆がいて、著者はそれらの聴衆とのかなり継続的な関係をもつことができる。
    • ウェブロッグのさらなる発展によって、将来の多くのブロッグはこのパターンのブロッグが増えるであろう。
    • しかしこれらのブロッグはトラフィックにおいてもブロッグの数においても少数であろう。
  • 不平等とは、大きなそして規制のない社会システムにおいては、混雑した道路での渋滞と同じ理由で発生する。それは誰かが意図したのではなく、むしろシステムが正常に機能した結果生じる確かな特質といえる。
    • ブロッグ登場の初めの数年間は、聴衆の分布は相対的に平等に分布していたことは、ウェブロッグの本質とは関係ない。当時は聴衆が不平等に分布するほど多くのブロッグがなかったが、今はそれがあるということにすぎない。
  • It is sure the Internet brings us a comprehensive media to communicate freely, but is seems paradoxical that the same media resulted in new type of inequality or divide.
  • インターネットは我々が自由に通信する上での普遍的にメディアをもたらしたことは確かだが、同じメディアが新たなタイプの不平等と分裂を引き起こしているのはパラドックスにみえる。

