2009-02-01から1ヶ月間の記事一覧

Python でグラフ・(疎)行列計算するためのライブラリを紹介するよ

PageRank とか HITS といったリンク解析ではグラフの計算が頻発するのだが、Python でそのあたり書くときの話をまとめてみる。グラフは行列で表現できる(ノード×ノード次元の行列 A を考えて、ノード i からノード j にエッジがあるとき、A[i,j] に値を入れ…

WEB+DB PRESS Vol.49 を読んで Spectral Hashing について考える

前の Key-Value Store 勉強会でO 野原くんに勧められた Spectral Hashing の論文(NIPS 2008)も読んでみた。前もスペクトラルクラスタリングについて書いたが、要はグラフ分割の問題に落とし込んで、厳密に分割を求めようとすると NP 困難なので、制約を少し…

三洋電機の創業者は松下幸之助の義弟だった

Apple について(というかこれではジョブズについて、になってしまっているが)勉強強化月間ということでジョブズ VS. 松下幸之助 ”言葉力”で人を動かす (アスキー新書)作者: 竹内一正出版社/メーカー: アスキー・メディアワークス発売日: 2008/12/10メディア:…

焼き肉を食べつつバズについて語る。

@overlast (ブログはこちら) さんに誘われて Mixi の中の人たち(先日の KVS 勉強会でニアミスしていたようだ)と韓国焼き肉。みなさん普通に人生楽しそう。この会社は(昨日の会社もそうだと思うけど)働いている人幸せだと思う。あと、テレビちゃんと見ようと…

Google の PageRank に関する参考書

今日は理論的な話をするのではなく、単なる参考書についてのポインタ。今週時間取ってGoogle's Pagerank and Beyond: The Science of Search Engine Rankings作者: Amy N. Langville,Carl D. Meyer出版社/メーカー: Princeton Univ Pr発売日: 2006/07/03メデ…

千差万別

東京某所へ会社見学に行く。オフィスの中は見られなかったが、いろいろおもしろいお話を聞けた。同じようなことやっている企業でも、会社ごとにここまで雰囲気が違うと、じっくり考えたほうがいいのでは、という気がする……。これまでいろんな企画の人に会っ…

アメリカから日本へ送る方法、FedEx は高いが速い

アメリカから日本への書類、FedEx で送られてきていたのだが、配達にかかった日数を見てみると、どうも2日程度で届いているらしい……。調べてみると、日本からアメリカに送ると、日本の夕方に出しても、現地時間の翌日には届くようである。すごい。ただ値段を…

スティーブ・ジョブズと Disney Research

昨日書いた通り Apple で仕事することになったので、今さらながらジョブズ本を読んでいる。今日読んだのはスティーブ・ジョブズ 人を動かす神ーなぜ、人は彼に心を奪われるのか? (リュウ・ブックス アステ新書)作者: 竹内一正出版社/メーカー: 経済界発売日:…

今年の夏は Apple でインターン(統計的手法を用いたことえりの研究開発)します。

前この日記でも取り上げたが、Apple で統計的手法を用いたかな漢字変換の研究開発インターンの募集があった。紆余曲折はあったが……。(自分で写真貼ってみて、白い MacBook に見えると思った)元々科学史・科学哲学専攻から自然言語処理の大学院に来たのも、あ…

KVS 勉強会に出て、自分でも書いてみたいなと思ったり。

Key-Value Store 勉強会なるものに行ってきた。キーと値をペアで保持するデータベースマネージャ的なものの勉強会。発表者豪華〜。開催を知ったのは上記 @kzk_mover くんの Twitter なのだが、他の人たちも Twitter で知ったらしい……。Twitter 恐るべし。tab…

Google Chrome とランキング学習。検索エンジンの進化には人手が重要

諸事情により最近 Internet Explorer を使っていたのだが、あまりに起動(や操作)が遅くて我慢ならなかったので、最近は Google Chrome を使っている。(現時点では Windows 用しかないが)Firefox でもほとんどアドオン使っていなかったせいかどうか分からない…

Yahoo! Research Key Scientific Challenges Program

昨日いろんな人が Yahoo! Research にいるというのを書いたらSmola や Keerthi も Yahoo! Research だと教えてもらい、けっこういるものだなぁと関心する。(Google と MSR と奪い合いになっているのかもしれないけど)で、職場の人からYahoo! Research Key Sc…

最大マージン kNN と SVM の関係: kNN も最近はがんばっています

先日書いた機械学習における距離学習の続き。kNN (k-nearest neighbour: k 近傍法)は Wikipedia のエントリにも書いてある通り、教師あり学習の一つで、あるインスタンスのラベルを周辺 k 個のラベルから推定する手法。memory-based learning と呼ばれること…

太陽を見るとくしゃみが出る人手を挙げて!

例のごとく月9のヴォイスを見る。やはりおもしろいな、このドラマ。月曜日は9時からドラマ、そして SMAP×SMAP、あいのりを続けてみるテレビデーである。(でもあいのりも3月で終了するということで一抹の寂しさがある)さて、今日のヴォイスは冒頭で石原さとみ…

アメリカの高校生から学ぶ進路相談。自分優先か恋人優先か、あるいは……

新宿に用事があったので、ついでにハイスクール・ミュージカル/ザ・ムービーを観てきた。(「誰も守ってくれない」とか「余命」とか「感染列島」とか観たかったが、暗いのもなぁ……と思って) これは高校生生活のミュージカルの第3作目で、正月に第2作目を観た…

週末の六本木はデートコース

せっかく赤坂に住んでいるので、行けるうちに六本木でも散歩しましょうか、ということで、春一番の暖かさと聞いて外に出かけてみた。東京の土地勘がない人のために補足すると、赤坂から六本木は徒歩10分くらいである(かくいう自分も山手線内側は魔界なので去…

大規模データ処理のための行列の低ランク近似 -- SVD から用例ベースの行列分解まで --

id:naoya さんのLatent Semantic Indexing の記事に触発されて、ここ1週間ほどちょくちょく見ている行列の近似計算手法について書いてみる。ここでやりたいのは単語-文書行列(どの単語がどの文書に出てきたかの共起行列)や購入者-アイテム行列(どの人がどの…

自然言語処理東大・東工大合同勉強会

NLP 若手の会メーリングリストで案内が流れていたので、東大でも東工大でもないがのこのこ合同勉強会に行ってみる。人はけっこういて16人ほどかな。多士済々という感じで、これだけの人数が集まれるのはすごいと思う(松本研じゃこうは行かないよなー)。三輪…

後生畏る可し—後進の者は努力しだいでどれほどの力量を身につけるかわからないので、おそれなければならない。

id:syou6162 さんがミーティング参加のために赤坂近辺まで来ているという(ことを Twitter で知った)ので、一緒にご飯を食べてくる。ちなみに、こうやって後輩の人と一緒にご飯を食べるのは、松本先生が学会に行ったら年上の人とはほとんど食事に行かず、学生…

プロフェッショナルとは、このことだったらこの人に聞きたいと思わせるような人

今日見たプロフェッショナル仕事の流儀 考古学者 杉山三郎がことのほかおもしろかった。メキシコのテオティワカンという遺跡の発掘に30年関わってきた人なのだが、実は元々希望する大学に入れず、第二志望でしかも希望していない経済学部に入ってしまい、留…

ふっくらあきたこまち

お昼に食べた「魚屋」というお店のご飯がおいしかった。夜日本酒飲みながら魚食べてみたいものである。夕ご飯、炊飯器のせいかあきたこまちのせいか分からないが、お米がおいしく炊ける。最近ご飯がおいしくていいのう。

Web API を用いたかな漢字変換

Web API を公開しているかな漢字変換といえば Yahoo! のかな漢字変換 APIが有名だが、最近こういうのを使って公開されているサービスが増えてきた。たとえばsimejiというアプリケーションは、Social IME (この頭文字から sime の部分が出てきたらしい)の Web…

東京は勉強会がたくさんあってよい

2月12日に自然言語処理の第一回 東大・東工大合同勉強会 (T2 Meeting) というのがあるらしい。昨年の NLP 忘年会で話が出ていたが、正式に開催の運びとなったようで。発表担当の2人のどちらの発表もおもしろそう。都合ついたら行ってみたいなぁ。(2月20日の …

東京生活に備えて emobile を買ってみた

しばらく東京にいるのでemobileを新宿ビックカメラで契約。行く前はヨドバシカメラかビックカメラで VAIO type P とセットで契約すると45,000円オフになるというので買おうかと思っていたのだが、詳細について聞いてみると セット契約(EeePC が1円、みたいな…

六本木・赤坂は生活費が高い

今日は新宿から六本木経由で帰ってきたので東京ミッドタウン地下の24時間営業スーパーで食材を買おうと思っていたのだが、野菜や魚が異様に高い! これ、奈良の物価の2-3倍するんだけど(白菜とかにんじんとか塩鮭とか、そういうレベルで)。同じ日本の中なの…

原宿で生活感を出すふたり

東京は奈良より確実に暖かいのだが、それでも夜は寒く、エアコンつけたりするのだが、寝ている間エアコンついていると起きたとき無性にだるい。仕方ないので布団を買えばいいかなと、出かけることに。木曜日からまた東京で2人暮らしで、布団を含めいろいろと…

花の金曜日

今週はあっちこっち行ったりしていたので金曜日で仕事が終わるのが本当に嬉しい……。今日は日付が変わる前に寝たいなぁー

係り受け解析に関するメモ

emiko-y さんが係り受け解析について書かれている。ちなみに masayu-a さんが書いた元のチュートリアル資料はこちらにある。いろいろ微妙なところのアルゴリズムや計算量の違いがあるようで、参考になった。今年は研究室内でのチュートリアルが開催されてい…

自分が楽しいことを、少しでも長く続けるために

IBM TRL オープンハウスでの鹿島さんのお話が更新されていた。実は鹿島さんとお会いするのは初めてだったのだが、鹿島さんの文章のファンなので、どういう方か楽しみにしていて、思ったように(?)飄々とされた方でとてもおもしろかった。ここのページでも な…

1週間で東京←→奈良を2往復すると体力的につらい

朝寝坊してしまったので急いで歩いて職場へ。10分かからないくらいかなぁ。途中ドラマか映画の撮影をしていたのだが、なんの撮影をしているのかも分からず、通り過ぎてしまった。もう少し余裕を持って出ていたら見ていたかも……。勤務が終わったあと、所用に…