Digg詳解
引言
如今,互聯網上的信息浩如煙海,一個人用一輩子的時間也不可能窮其究竟。要想在成堆的新聞報道中挖掘出所需內容并將它們縮減到一個可管理的規模,可能需要一個龐大的團隊才能辦到,此外還需要另一個團隊來挑選出普通網絡用戶可能感興趣的內容。之后,再由一個團隊報告用戶實際上對哪些內容真正感興趣。除此模式之外,您是否訪問過Digg.com網站呢?這是一個由用戶推動的新聞網站,通過幾十萬人的共同努力來查找、提交、評論和撰寫來自網絡各個角落的新聞故事。
Digg與Slashdot類似,它沒有專門的編輯人員,是一個采用民主方式的新聞提交網站。在Digg,網站用戶做出有關網站內容的所有決定。大多數時間里,這種方法看起來非常奏效。Kevin Rose曾經是TechTV的電視名人,他于2004年12月在Jay Adelson和Owen Byrne(現在分別擔任Digg的首席執行官和資深軟件工程師)的幫助下創立了Digg。他只花了1,000美元就開發并推出了Digg.com,這在很大程度上要歸功于開源軟件的功勞。六個月后,網站有了大約25,000名注冊用戶。短短一年后,Digg便擁有了80,000名注冊用戶和每天500,000次的不重復訪問量。2006年5月,Digg的注冊用戶數量達到300,000,擁有每天100萬次的不重復訪問量,每天的新聞帖子數量則達到1500篇。
龐大的Digg社區由擔任不同角色(這些角色經常發生重疊)的用戶組成。新聞提交者負責張貼他們在博客、專業新聞網站和某些不知名的網絡角落找到的新聞報道。這些報道都進入到Digg的內容序列中,臨時評論員則在這些內容序列中查找自己感興趣的內容并把它“挖掘”出來——也就是單擊一個按鈕,讓Digg.com知道他們認為這篇報道很出色。在文章得到足夠的挖掘(并且滿足一系列其他基本要求)之后,它會被提升到主頁中。此外,還有一些真正的專職評論員,他們每天花費數小時的時間梳理內容,并主動提升好的新聞并報告不好的新聞(如果有足夠多的人報告說某篇新聞不好,則它最后會被刪除)。實際上,這些人決定了哪些新聞能夠出現在主頁上從而得到數以千萬人的點擊和瀏覽。有時候訪問量之大甚至會意外地使Web服務器崩潰。如果訪問量從每天400人突然增長為兩小時內5000人,小型網站和家庭服務器可能會變得不堪重負。而對于博聞網這樣的網站(我們的服務器能夠處理這樣的流量),我們可以很容易地知道我們何時被“挖掘”了。當我們的統計數據表明某篇文章超過了每小時數千次的正常點擊量,我們便會檢查一些主流的新聞匯總站點(Slashdot、Fark和Digg),看看是誰把它挖掘出來了。
最后,還有Digg的讀者,他們大多是Digg的用戶,享受著負責將最佳新聞提升到主頁上的Digg志愿大軍的辛勤勞動成果。作為報答,讀者們幫助Digg保持良好的廣告收入,讓新聞提交者和挖掘者能夠繼續他們的勞動。
盡管某些人可能將此稱作一種根本性的變革,但是網站自身的基本功能仍然非常簡單和直觀。使用Digg的過程很簡單。當您訪問Digg.com主頁的時候,已經可以看到當前一些最受歡迎的新聞報道,足夠多的用戶挖掘了這些報道并將它們提升到主頁上。
|
|
如果想做更多事情而不只是閱讀主頁新聞,可以在Digg.com上執行以下幾類主要的操作:
注冊Digg
只需花大約5秒鐘的時間您就可以在Digg中創建一個帳戶。注冊帳戶之后,便可以使用網站的所有功能,并在提交和挖掘新聞報道方面發揮積極的作用。
|
|
瀏覽和挖掘Digg
瀏覽Digg的“Upcoming Stories”(即將發布的新聞)序列中的新聞,通過單擊每篇新聞標題左側的“Digg”(挖掘)按鈕來讓Digg知道哪些報道是您喜歡的。(您挖掘的每篇文章都會保存在您的帳戶中以供今后查看,所以您最后可以得到一個包含曾經挖掘過的所有文章的動態列表。)某篇報道的挖掘次數越多,它就越有機會進入主頁。此外,您還可以按類別瀏覽該序列,并且可以在“Story View”(新聞視圖)和“Cloud View”(潛力新聞視圖)中來回切換。
|
在“Story View”(新聞視圖)中,內容序列以簡單的垂直顯示方式排列各篇新聞。可以按日期、挖掘量或者評論數量來對它們排序。在此視圖中,我們正在瀏覽“All”(全部)類別。 |
|
在“Cloud View”(潛力新聞視圖)中,內容序列以動態列表方式排列新聞,讓您一眼便可以看到眾多的新聞標題。新聞的挖掘量越大,它的標題就越大,顏色也越藍。 |
評論
如果發現某篇新聞特別有趣并且想補充一些內容或與其他Digg用戶討論它,可以單擊新聞簡介下方的“comments”(評論)鏈接。可以在評論頁面的底部添加您自己的意見。
埋葬
作為一名Digg用戶,主動報告重復新聞(重復新聞是不允許的)、死鏈、錯誤新聞、過時新聞、缺陷新聞以及垃圾信息的工作將得到大家的贊賞,可以單擊每篇新聞簡介下方的“problem”(問題)下拉列表中的相應鏈接來報告相關信息。如果有足夠多的用戶報告說某篇新聞有問題,或者說希望“埋葬”它,它便會從Digg的新聞序列中消失,而且只會顯示在搜索結果和用戶檔案中。
提交
最后,您自己也可以將新聞張貼到Digg序列中,希望其他用戶發現它的有趣之處并將它挖掘到主頁中。如果您的新聞做到了這一點,會給您帶來很大的樂趣。您需要做的就是單擊主頁左上角的“Submit a Story”(提交新聞),進行關鍵詞搜索或URL搜索,并提供所張貼新聞的標題、鏈接或簡短介紹(如果系統顯示您的新聞尚未提交)。
|
|
|
|
提交的新聞會立即出現在“Upcoming Stories”(即將發布的新聞)序列中,所有人都可以在這里看到它。
|
|
它要么由于得到足夠的挖掘而進入主頁,要么由于沒有得到足夠的挖掘(或者由于多位用戶報告它存在問題)而最終消失。
上面介紹了Digg.com的大部分基本知識,但是您還可以在Digg.com上進行更多的操作。它是新聞網站、博客訂閱程序和“社交書簽”中心的集合體。可以在Digg中使用的部分其他功能包括:
- Digg間諜:通過Digg間諜可實時了解Digg.com的活動。可以在新聞獲得提交、提升、挖掘和報告時得到相關信息。
- 社交書簽:添加朋友并通過您自己的檔案頁面來跟蹤他們在Digg上的活動。
- 播客:訂閱Diggnation播客視頻,聽Digg的創立人及其伙伴討論每周Digg上最受歡迎的新聞和解決有關Digg的各種問題。(請參閱什么是播客來了解這種平民媒體。)
- 博客連接:如果您的博客空間是由Typepad、Blogger、Live Journal、Moveable Type或Wordpress提供的,則可以在Digg上的任何新聞中通過一次單擊將新聞添加到博客中。只需單擊任何新聞簡介下方的“blog story”(將新聞加入博客)鏈接即可。(還可以在您自己的博客文章中添加一個“Digg this”(挖掘此文章)按鈕,讓您的讀者將某篇文章快速提交給Digg。然而這并不是一個由Digg.com開發或認可的功能,但是Digg看起來并不介意人們這樣做。)
- RSS 源:通過一個RSS源將Digg新聞添加到您自己的網站中,您可以通過多種方法來選擇要提供的新聞——可以自動添加所有Digg主頁文章、您挖掘或評論的所有文章以及您的朋友挖掘或評論的所有文章。
- 用電子郵件發送新聞:通過單擊新聞簡介下方的“email this”(用電子郵件發送此文章)鏈接,可以用電子郵件將任何新聞發送給朋友。
- 阻止/報告用戶:如果發現您不喜歡某個人提交的文章或發表的評論,可以阻止該用戶,使與該用戶有關的任何信息都不再出現在您的Digg視圖中。如果有足夠多的Digg用戶阻止了該用戶,那么Digg會禁止該用戶登錄。
Digg網站的用戶承擔了大量的工作。表面上,是由志愿者群體來不斷提供Digg主頁上值得一看的新聞內容,但是如果試想一下要為執行相同工作的人支付多少薪水,您便會知道這是一種多么令人稱道的業務戰略!而在背后,Digg只有12名真正的員工和大約75臺服務器。在下一節中,我們將了解使Digg得以順利運轉的一些幕后技術。
Digg的幕后技術
對于一個每月頁面瀏覽量超過2億次(2006年4月數據)的網站,Digg的技術框架顯得相當簡潔。與任何專有系統一樣,Digg的技術部門不會將它的技術秘密全盤托出。但是我們還是多多少少探聽到了一些信息,Digg的整個系統建立在LAMP(Linux、Apache、MySQL、PHP/Perl/Python)基礎之上,其編程模型則將多個服務器應用程序(使用PHP編寫)緊密聯系在一起,并且使用了MySQL數據庫這樣的東西。它允許系統架構中使用多種語言進行交流,同時將因翻譯轉換工作而產生的停頓降到了最低。
在2006年6月14日錄制的Diggnation播客視頻中,凱文?羅斯談到服務器的總數為75臺。在博聞網通過電子郵件進行的訪談中,Digg的CEO Jay Adelson確認服務器為Penguin Computing和Sun的服務器,并且說Web服務器運行PHP和Debian Linux操作系統,而數據庫服務器則運行MySQL數據庫管理軟件。Digg實際上并不需要存儲太多的數據,因為它處理的幾乎都是文本數據,但是Adelson說當前的系統具有無限的擴展能力。在2005年12月的Mad Penguin訪談訪談中,Adelson稱Digg的基礎結構“每月都要翻一番以滿足不斷增長的用戶需求”。Digg的基本架構如以下所示:
Diggnation
Digg并不僅僅是一個新聞網站。它還包括一個由創立人凱文?羅斯撰寫的官方Digg博客和一個由Rose與前TechTV主持搭檔Alex Albrecht一起主持的播客。Diggnation播客報告每周Digg上最受歡迎的新聞文章,以及您在其他任何地方都沒法打聽到的其他Digg相關新聞。請參閱Rev3:diggnation了解更多信息并進行訂閱。
??????????? Digg.com技術基礎結構概覽
在這個系統中,用戶負責提交和挖掘新聞,并可利用Digg.com上提供的所有其他功能。Digg不使用Cookie,只在服務器端存儲數據,所以您的用戶數據(以前挖掘的文章、朋友、評論等)都保存在您的Digg檔案中(該檔案則存儲在Digg數據庫中)。在訪問網站時,您需要進行登錄,這實際是一種初步安全措施,確保用戶每次訪問網站時的合法性。在系統的各個位置上有許多被Digg稱作“因果檢查”的合法性檢查:
- 當用戶嘗試提交文章時,系統會檢查提交的文章是否合法——是否是垃圾文章(由計算機自動提交的文章)以及用戶是否合法有效(是否被禁止或者受到其他限制)。根據Adelson的說法,因果檢查系統還會考慮其他多種因素,包括某些“Digg的重要用戶主體的唯一屬性”。
- 如果某篇提交的文章被頂上來并將進入某個類別主頁或網站主頁(這由多種因素決定,包括文章的挖掘量和挖掘速度),系統會進行檢查以確保挖掘是有效的。其中一項檢查是查找僅為了提升某篇文章而創建的欺騙性帳戶。Adelman說,“我們的因果檢查系統知道如何區分僅為了挖掘某一篇文章而創建的用戶和曾經與站點進行過交互的用戶。”該系統還會查找自動挖掘現象,也就是通過計算機進行文章挖掘,以將某篇文章通過欺騙方式提升到主頁中的現象。
Adelman確認,Digg在幕后沒有任何編輯控制,無論是文章的提交、提升還是埋葬(從Digg序列中刪除某篇文章)均是如此。除了會讓用戶開啟一個不文明用語過濾器以屏蔽某些不文明用詞之外,提交文章時不存在任何審查機制。而且Digg管理“埋葬”的方式也與管理其他操作相同,采用了一種專有算法。系統會運行一個“取消提升算法”,它決定了用戶報告的文章何時應該從網站主要頁面中消失。
所有的這些聽起來都十分民主和具有超前思維,Digg將我們帶到了平民網絡的道路之上,將普通大眾變成了主編、記者、編輯、股票交易商和百科全書編撰者。但是在2006年中期,人們對于Digg是否真的完全由用戶推動也引起了一些爭議和質疑——至少在少數人的腦子里和口頭上是如此。在下一節中,我們將了解用戶對Digg的看法。
現金
Digg.com在2005年11月從包括Omidyar Network(創建eBay的Pierre Omidyar和Marc Andreessen(Netscape的共同創立者)在內的一個高科技投資集團那里獲得了280萬美元的風險投資。
關于Digg的爭議
科技博客網站ForeverGeek的麥吉弗在2006年4月曾說,“Digg的99%都是很出色的。”雖然在后來與Digg的創立人凱文?羅斯發生爭吵之后,這位博客作家改變了他對Digg的看法,但是大多數人都知道他最初的評價是正確的。在Digg上,人們爭先恐后地張貼吸引人的文章,Digg也會經常提供一些未被發掘的精彩內容,引導人們發現那些不為人知但內容精彩的博客,大部分網站的用戶都自覺自愿地致力于提升好文章和埋葬差文章的工作。理論上,用戶推動型網站的新聞立場是真實和難以被篡改的,至少難以被大公司和過于熱心的編輯所改變。當然,某些人也許會不同意這一觀點,尤其是最后一點——是否存在編輯控制是麥吉弗產生怨言的原因,我們過一會將談到這個問題。
在任何基于Web的社區中,抱怨和不滿都是正常的。對于Digg,長時間以來最大的怨言之一就是對文章的評論,這些評論經常是粗魯或無聊的,并不能引起人的深思或就此展開討論。但是通常的情況是,隨著網站的成長,網站可能被濫用的顧慮也隨之增長。這些顧慮大部分與我們在前面提到過的欺騙性Digg活動有關,例如:垃圾文章、欺騙性帳戶和自動挖掘。其他可能的濫用包括:由于缺少編輯控制而利用網站進行產品推廣的可能。沒有道德的網站經營者可能會張貼一些看起來具有極大誘惑力的文章,讓Digg用戶點擊和瀏覽他們的網站,從而產生頁面瀏覽量并增加廣告收入。2006年3月,一種十分不尋常的濫用引起了Digg的注意,當時有一系列的帖子都在散布一個謠言,稱Google將收購Sun Microsystems,這樣的收購可能會使Sun的股價迅速竄高。該文章的提交具有很強的連續性,每天至少有四篇,而且Digg的用戶會將其中的幾篇提升到主頁上。每一次,都是由相同的Digg用戶來挖掘這些文章。事實上,這僅僅是一個謠言,一些人懷疑這些文章的張貼者試圖利用Digg散布虛假謠言來刺激Sun的股價以從中牟利。
那么,讓我們回到“99%是出色的”這一評價上,也就是說Digg.com上還有另外的1%具有不可避免的錯誤并且需要改進,以便捕捉住所有垃圾信息、自動挖掘行為和對網站的其他惡意濫用。現在,網站每天要處理100萬次訪問和1500篇提交的新聞,但是麥吉弗最后的怨言(這引起了一場小型論戰,幾乎所有的科技博客都對此進行了報道)與上述所有內容都無關。
開始時爭論是小范圍的而且影響不大。麥吉弗經常向ForeverGeek和Digg提交文章,而他在Digg上發現了一件奇怪的事情:由同一用戶提交的兩篇文章都被提升到了主頁中,它們的挖掘者和挖掘順序幾乎完全相同,而凱文?羅斯碰巧是這兩篇文章的挖掘者之一。盡管麥吉弗無法從中得出任何結論,但是顯而易見的一點是:Digg漏掉了一種自動挖掘的情況,而凱文?羅斯作為挖掘者之一則令此事件更加奇怪和難以解釋,Macyger因此離開了Digg。他將自己的觀察結果發表在ForeverGeek的博客上。
更巧的是,一位ForeverGeek的讀者(不是麥吉弗)將該博客文章提交到了Digg上。接下來,他們發現該文章是不可挖掘的(被迅速埋葬了)而且禁止了ForeverGeek的URL,用戶無法再提交任何ForeverGeek上的文章。被埋葬的文章很快便從網站中徹底消失了。
麥吉弗接下來又張貼了一篇題為“Digg Corrupted:Editor's Playground, not User-Driven Website”(Digg的墮落:編輯的游戲場,而非用戶驅動型網站)的文章,該文章迅速傳播開來。在Digg的官方博客中,凱文?羅斯發表了一篇對論戰的回應,簡單表明這件事并沒有值得探究的秘密。他說,他也同樣會挖掘他認為有趣的文章,而且如果在那種情況下發生了自動挖掘,他也毫不知情。至于ForeverGeek被禁止,他說,這是因為ForeverGeek違反了Digg有關垃圾信息和欺騙性帳戶的規定。
麥吉弗則不肯輕易罷手,他認為羅斯的回應沒有回答任何實質性問題,并在ForeverGeek上使用專為本事件開辟的一個流動帳戶繼續質疑該網站的根本前提,即沒有編輯控制這一問題。很快,沒有任何解釋,Digg.com解除了對ForeverGeek的禁止,可以隨意提交它的任何文章。
除了這個未解決的小插曲,Digg似乎在流量和資金方面做得很好,而且它制定了一些計劃。技術團隊正在解決基礎結構的擴容問題,以應付超出當前流量10倍的更大流量。最新版的Digg包括了一些新類別,囊括了所有新聞類型,而不僅僅是科學和技術新聞,并且增加了一個“Top Digg Users”(頂級Digg用戶)功能,幫助您了解Digg網站上最活躍(也因此最有影響力)用戶的活動。通過這種類型的跟蹤,用戶可以輕松查找要添加到朋友列表中的人員,使自己跟上他們的挖掘活動步伐。
類似Digg的網站
del.icio.us
FARK.com
linkfilter.net
reddit.com
Slashdot.org
電子發燒友App














評論