はてなをクローリングしてる暇がないのでライブドアクリップ貰った!

はてなをクローリングしてる暇がないのでライブドアクリップ貰った!をはてなブックマークに追加 はてなをクローリングしてる暇がないのでライブドアクリップ貰った!をdel.icio.usに追加 Yahoo!ブックマークに登録 はてなをクローリングしてる暇がないのでライブドアクリップ貰った!をGoogle Bookmarksに追加

ライブドアがライブドアクリップのデータセットを提供しているという事なので早速申請してデータを頂きました!やっほーい!\(^o^)/

貰ったデータはcsv形式で300万件くらいありました。
なんかアカウントid的な番号(実際のライブドアアカウントのidではないと思います)とURL、登録日時とタグをスペースデリミタで300万件くらい。157万件とのこと。確かにはてなをクロールしてる暇があるなら頂いた方が良いかもしれません。とりあえず集合知プログラミングを買ってあるので、やりたいと思っていた分析的なのをやってみたいと思います。ハイパーパイソン勉強タイムが来ましたよ!

「これはひどい」とか「死ねばいいのに」タグも沢山あるよ!気になっちゃう「エロ」タグもたっくさnいやいや研究資料です。これはワタクシがデータマイニング的な分析的なアルゴリズムの研究のために利用される貴重な資料です。その証拠に一応クラスタ分析のエントリも書いてるよ!ネタ的なクラスタ分析もあるよ!(証拠になってないところが面白いよねというオチ)(何このオチ)(面白くない)(死んで詫びろ)おまえが詫びろー!!!(色々よくわからなくなって絶叫)

コメントをどうぞ