Facebookのデータ事業の一覧

Facebookのデータ事業の一覧

Facebookの上場により、同社のビッグデータモデルはますます注目を集めています。オレゴン州プリンビルに新しく建設された Facebook データセンターは、世界で最もエネルギー効率の高いデータセンターとして知られています。 Facebookのデータビジネスの具体的な特徴は何ですか?ここに簡単な目録があります。

データ収集

タイムライン

2011年12月に公開されたタイムラインは、主に「プロフィール」の調整が行われました。 Facebook プロフィールは個人のファイルや情報に相当し、簡単に言えば個人のホームページです。新しい個人プロフィールは、以前のバージョンよりも視覚的にインパクトがあります。 Facebook は新しいタイムライン インターフェースを開始しました。これは、ステータス、写真、ビデオなど、Facebook 上で個人が投稿した情報を整理し、Facebook 上の自伝のように、より構造化された方法で表示します。

いいねボタン

この機能により、ユーザーはお気に入りのページをマークして Facebook の検索結果に含めることができる。これは、Google がページ間のリンクを使用して検索ランキングを決定する方法に似ている。 Facebookは「ユーザーが『いいね!』ボタンをクリックする限り、Open Graphプロトコルをサポートするすべてのウェブサイトが検索エンジンに表示される」と述べた。 Facebook は Open Graph プロトコルを使用して検索エンジンのインデックス範囲をさらに拡大し、Google に脅威を与えることになります。

データストレージ

メムキャッシュ

これは、Facebook が Web サーバーと MySQL サーバー間のキャッシュ レイヤーとして使用する分散メモリ キャッシュ システムです (データベース アクセスが比較的遅いため)。 Facebook は長年にわたり、ネットワーク スタックの最適化など、Memcached とその周辺ソフトウェアに多くの改良を加えてきました。 Facebook では、数千の Memcached サーバーに常時数十 TB のデータがキャッシュされています。これは世界最大の Memcached サーバー クラスターかもしれません。

干し草の山

Haystack は Facebook の高性能画像ストレージ システムですが、厳密に言えば写真の保存に限定されません。アップロードされた写真は 200 億枚以上管理する必要があり、各写真は 4 つの異なる解像度で保存されるため、写真の数は 800 億枚以上になります。何億枚もの写真を処理できる必要があるだけでなく、パフォーマンスも重要です。 Facebook は CDN 上の写真を除いて 1 秒あたり約 120 万枚の写真を処理しており、これは驚異的な数字です。

カサンドラ

Cassandra は、単一障害点を回避する分散ストレージ システムです。これは NoSQL 運動の代表的な例であり、オープンソース化されています。それは Apache プロジェクトにもなりました。 Facebook は受信トレイの検索にこれを使用しており、Facebook 以外の他のサイトでもこれを使用しています。

データ分析

Hadoop アーキテクチャ

Hadoop は、現在、分散/並列コンピューティング用の最も人気のあるオープンソース ツールです。これはストレージ用の分散ファイルシステムであるだけでなく、多数のクラスターコンピュータを構築して大規模なデータセットの分散ストレージやアーカイブを実現するためにも使用できます。 Facebook は Hadoop の熱心なユーザーであり、ソースコードへの貢献者でもあります。 Facebook は、現在 Apache の Hadoop サブプロジェクトに含まれている 2 つの重要な Hadoop コンポーネント、Hive と Thrift も提供しています。

ハイブ

Hive は Facebook から生まれたもので、Hadoop に対して SQL クエリを実行できるため、プログラマー以外の人でも簡単に使用できます。 Hive は Hadoop をベースにしたデータ ウェアハウス ツールです。構造化データ ファイルをデータベース テーブルにマップし、完全な SQL クエリ機能を提供できます。 SQL ステートメントを MapReduce タスクに変換できます。

動物園の飼育係、倹約家

Hadoop のサブプロジェクトには、Google Chubby に似た機能を提供する Zookeeper 分散ロックも含まれます。 Thrift は、PHP や Ruby などの複数の言語をサポートする Hadoop のクロス言語インターフェースです。

ビッグパイプ

BigPipe は、Facebook が開発した動的 Web ページ処理システムです。最適なパフォーマンスを実現するために、Facebook は各 Web ページをチャンク (「ページレット」と呼ばれる) で処理するためにこれを使用します。たとえば、チャット ウィンドウやニュース フィードなどはチャンクで送信されます。これらのページレットは並行して動作できるため、パフォーマンスが向上するだけでなく、一部のページレットが失敗したり中断されたりしても、ユーザーの通常のアクセスに影響はありません。

<<:  「目の保護」デスクランプを「オン」にする正しい方法

>>:  糖尿病患者は血糖値を安定させるために食事で何に注意すべきでしょうか?タブーと適切さを一度に説明

推薦する

エアフライヤーで揚げた食べ物が乾燥しすぎている場合はどうすればいいですか?エアフライヤーで揚げられない食べ物は何ですか?

エアフライヤーは多くの友人が勧める魔法のデバイスです。しかし、一部のネットユーザーは、使用後、エアフ...

脊髄損傷は回復不可能なため、病院前救急治療を念頭に置く必要がある

脊髄損傷(SCI)とは、さまざまな原因により脊柱管内の神経構造(脊髄、神経根、馬尾を含む)が損傷し、...

『PERSONA5 the Animation』レビュー:魅力的なキャラクターと深いストーリーが織りなす最高の体験

『PERSONA5 the Animation』:心の怪盗団が織りなすピカレスクロマン 『PERSO...

更年期の女性が再び月経を迎える場合、それは若返りの兆候ではなく、子宮内膜がんの兆候です。

更年期障害の再発には理由があり、偶然ではありません。通常の女性は、ある年齢に達すると閉経を迎えます。...

彼氏の手でやったら感染するでしょうか?彼氏がいつも私の中に手を入れるとどんな危険があるのでしょうか?

カップルであろうと、パートナーであろうと、人生においてセックスという話題について必ず話し合うことにな...

美味しいものが「毒」に変わる、生の魚介類を食べて本当に大丈夫?

インターネットでは、多くのブロガーがトラフィックを増やすために生の魚介類を食べることがよくあります。...

ある女性は携帯電話を頻繁にいじっているため、指が「動かなくなって」動かなくなってしまう。腱鞘炎にご注意を!

中国科学技術ニュースネットワーク、12月2日(徐明陽)陝西テレビニュースによると、最近、陝西省西安市...

ブラック★★ロックシューター DAWN FALL - 初音ミクの魅力と深みを探るレビュー

ブラック★★ロックシューター DAWN FALL - 未来への戦いと希望 2022年に放送されたTV...

IHS: 中国の4Gスマートフォン出荷台数は2014年に15倍に増加すると予想

市場調査会社IHSによれば、中国の4Gスマートフォン市場は2014年に急成長期に入り、4Gスマートフ...

『虐殺器官』:衝撃のストーリーと深遠なテーマを徹底解剖

『虐殺器官』:伊藤計劃の遺志を継ぐ壮大な物語 『虐殺器官』は、2017年2月3日に公開されたアニメー...

GTX1066 グラフィック カード (GTX1066 グラフィック カードの強力なパフォーマンスと利点を探る)

強力なグラフィック カードである GTX1066 は、その優れたパフォーマンスと高い安定性により、多...

牡丹は牡丹の一種ですか?牡丹と芍薬の見分け方は?

牡丹も芍薬も生活の中でよく見かける花ですが、花に馴染みのない友人たちはいつもこの2つを混同してしまい...

『鋼の錬金術師 FULLMETAL ALCHEMIST』の映像特典「ハガレン 4コマ劇場」を徹底評価!

鋼の錬金術師 FULLMETAL ALCHEMIST [映像特典] ハガレン 4コマ劇場 - レビュ...

高齢になって白内障になった場合、手術を受けるべきでしょうか?

白内障は一般的な眼疾患の一つです。中高年の方は白内障に悩まされる方も多いでしょう。しかし、現在白内障...

Oppo 携帯電話の録音ファイルの保存パスと使用方法 (Oppo 携帯電話の録音ファイルを簡単に見つけ、その保存パスを管理します)

Oppo のスマートフォンで録音する人が増えている会議の議事録、講義ノート、個人的なメモなど、録音は...