June 2005
June 29, 2005
Musical Batonが廃れていく、そのメカニズムって?
Musical Batonなのだが、先々週くらいがピークで、既に書かれる数が減ってきているという感じがする。blogwatcherの頻度表(下図)を見ても、今月20日ごろがピークでそこから右肩下がりなので、感覚として間違っているわけではないだろう。
んで、こういうモノがどういうふうにして収束していくのか、そのメカニズムが気になる。そういうモデルを定義できるんだろうか。
「blogに投稿されるMusical Batonの記事数」について考える。次のように決まるとおもう。
Musical Batonの記事数(Na) = バトンを受けとった人の数(Nr) × 受け取った人が実際に記事を書く確率(Pw)
ここで、Musical Batonの性質を考えると、Nrは基本的に増加し続けることが予想される。まあ、5人の人にバトンを回すというルールから考えるとそうなるね。人によっては次の人にバトンを回さなかったり、1人の人が重複してバトンを受け取ったりするから、額面通りに増加していくわけではないが。
なので、もしPwが常に一定であれば、Naもひたすら増加し続けることになる(現実にはbloggerの数は有限なのでそうはならないけど)。ところが、Naは既に漸減に転じているようだ。上の式から考えるとPwの値が落ちたことになるんだけど、なんで落ちるんだろう。その理由が知りたいなあ。どういうパラメタがあって、それらがどういうふうに絡み合っているのか。
June 22, 2005
CNET Japan lnnovation Conference 2005 Summer(CJIC 2005 Summer)のメモ
月曜日に「CNET Japan lnnovation Conference 2005 Summer」へ逝ってきました。そのメモです。
聴いていて「ほほう」とか「ふうん」とか思ったことを書き留めたもので、内容をしっかり網羅しているわけではありません。
Jim Lanzone氏 @ AskJeeves
- インターネット広告は1,800億円。うち検索エンジンのシェアは350億円。まだまだ伸びる。
- 上位20%のヘヴィー・ユーザが65%のクエリを投げる。
- EveryThing is Search! amazonもweather.comもmatch.comもみんな広い意味でのサーチ。インターネット・イコール・サーチ。
- 利用者が検索エンジンに求める要素。relevance -> speed -> feature。relevanceはどの調査でもトップに来ている。
Tomi J Poutanen氏 @ Yahoo!
- 一日に10億クエリ
- 画像の数は18億
- AltaVista: DECのメインフレームを、たったの1台。
Inktomi: Sunのワークステーションでクラスタ作ってた。
yahoo: cheapなx86ハードウェアを沢山 - 検索エンジンが扱うのは"information"ではなくて"human knowledge"。informationは表現行為の結果に過ぎず、あんま本質的じゃない。
Patrizio Spagnoletto @ Yahoo
- それに興味を抱いてから、購入に至るまでには幾つかの段階がある。
discover (それの存在を知る)
research (それについて調べる)
compare (候補を比較する)
purchase (買う)
ここで重要なのが、それぞれの段階において、ユーザが欲しがるページは異なるということ。
どの段階のユーザにreachしたいのか意識しろ。 - キーワードに対する広告を無条件で受け入れているわけではない。
専門のチームが居り、彼らがチェックして妥当性が低いと判断すればリジェクトする。 - 10万の顧客。9割が小規模な企業。
- 47%のクエリは3以上の単語。(この数字は大きいと感じるが、これは調査対象が英語圏のWebのユーザであることが大きく、日本語圏のWebではかなり小さい数字になると思われる)
Slar Kamangar氏 @ google
- サーチに検索が入ることは不自然ではないし、嫌われるようなことでもない。「もっとも適切な解答が広告である」という局面は少なからずあり、そこでマッチングを行うことによって我々は報酬を得ている。しかも報酬を払うのは企業の側でありユーザは一円も払う必要がない。みんながhappy。何も悪いことはない。
- key strokeを少なくしたい。ユーザの打つキーの数を一つでも減らしたい。
Post a comment to 'CNET Japan lnnovation Conference 2005 Summer(CJIC 2005 Summer)のメモ'
電気通信大学の Google ユニバーシティ検索へようこそ
電気通信大学の Google ユニバーシティ検索へようこそ
上の検索ボックスにキーワード入力して下さい。
Google ユニバーシティ検索 の全リストをご覧ください。
なんだこりゃ。
これって前からあったのかな。
Google ユニバーシティ検索
http://64.233.187.104/univ/ja/uec
June 21, 2005
入会金10万円のSNS
わろた。
First Class Network[FCN]は選ばれた方のみご利用頂けるワンランク上のファーストクラスコミュニティサイトです
First Class Network[FCN]とは名実共にFirst Class(一流)と認められる方のみがご参加頂ける新しい形のコミュニティサイトです。
・入会金 ・・・・・・10万円 (退会後のご返金は承っておりません)
・会費 ・・・・・・・月額1万円
……んで、そいつが「選ばれた方」であることをどうやって証明させようというんだ。
「年収いくら以上」「総資産いくら以上」のような定量的な基準を示すならまだしもだが、そういったものは提示されていない。この業者に安くないカネを払えばそれが一流の証明になるのか。
もし、こいつらの言うようなコミュニティがオンライン上に成立しうるとしても、それはこういう形ではありえない。
木村剛や真鍋かおりのblogにトラックバックSPAMを打っているのには失笑。
First Class Network
http://www.onlyone-co.jp/
blogを書くときにURLをリンクするのがだるい
blogを書くときにはURLをリンクするという作業がとても高い頻度で発生しますが、これが単純作業きわまりなく、一つ二つなら我慢できるんですが数が多いとだるくて発狂モノです。なんとかならんのでしょうか。
一例として、記事中の"今日の井原"という単語に、このblog(http://blog.windy.ac/)へのリンクを貼ることを考えてみましょう。ぼくは普段、以下のような手順でやっています。
・MovableTypeの記事投稿フォームで記事を書いているところで、「"今日の井原"にリンクを貼りたいな」と思う
・ブラウザのgoogleツールバーに、"今日の井原"と打ち込んでgoogle検索
・検索結果の中から目的のものを探す(たいてい一番上に来ている)
・今日の井原のURLをこぴぺ
・記事投稿フォームに戻って、記事の中の該当箇所にリンクを貼る
blogの記事でURLをリンクするときには、相手先のサイトのトップページにリンクを貼るケースが多く、そのようなケースではgoogle等の検索結果のトップに当該サイトが来ることが期待できます。そんな作業は自動化されて欲しいものです。
リンクを貼りたい部分を選択してボタンを押すと、バックグラウンドでgoogle APIを使って検索をしてくれて、検索結果のトップに来たURLをリンクしてくれる、それだけの機能を実装してくれれば、おそらくみんながhappyになれるはず。
誰か作ってくれないかしら(他力本願)
Musical Batonの件
alectropeさんから、Musical Batonのご指名を受けていたことを知りました。
alectropeさんのサイトで知ったわけではなく、まとめサイトで自分のblogの名前を見つけて吃驚したという次第。ごめんなさい。こういう祭り(?)に乗っかるのは嫌いじゃないので、謹んで書かせていただこうと思います。
まとめサイトではMusical Batonが次第に広がっていく様子が樹形図で見られるんですが、日本のblog界に入ってきてまだ一ヶ月だというのに、この広がりっぷり。チェーンメールかネズミ講かという感じ。最初に考えた奴は頭良いなあ。音楽の話だったら誰でも書けるからね。amazonにリンクすればアフィリエイトでお小遣い稼ぎになるかも知れないし。
樹形図をざっと見て、名前を知ってるblogを片端から開いてみると、ちゃんと書いてるところは少ない。半分もないくらい。中には「こういうの嫌いだからおれは書かないよ」って書いてる人も。それはそれで正しい。
せっかくこれだけ多くの人が、決まったフォーマットに基づいて音楽の好みを書いて居るんだから、ちゃんとクローリングしてデータベース化してやりたいところだけど、やろうとするとかな〜りめんどっちいだろうなあ。そういうのを簡単に出来る枠組みがあったらいいのに。
んでは、ここからは本題に。
Total volume of music files on my computer
(PC内にある音楽ファイルの容量)
20GBのiPodが半分近く埋まってるので、10GB弱ということになるのか。邦楽で半分、洋楽で1/4、アニメソング・同人音楽で残りの1/4という構成です。
Song playing right now
(今聴いている曲)
『LOVE☆トロピカーナ ファイナル/ハレ Sister MAYO with ファイナル隊』
えーと。『ジャングルはいつも ハレグゥ FINAL』ってアニメの主題歌です。こんなんですいません。
The last CD I bought
(最後に買ったCD)
『The Eccentric Opera/The Eccentric Opera』
オペラやクラシックの名曲をテクノ調にアレンジして聴かせるユニット。ジャンルで言うと何になるんだろう。テクノ? 先日、中古CD屋のワゴンの中に転がっていたのを見つけて購入。
質の高い音楽を作っていたと思うけど、あまり売れていなかった。まだ活動してるのかな。
Five songs(tunes) I listen to a lot, or that mean a lot to me
(よく聞く、または特別な思い入れのある5曲)
・約束はいらない/坂元真綾
大好き。
・さくらんぼキッス/KOTOKO
KOTOKO嬢のbest tuneであると同時に、「萌えソング」という新しいジャンルを切り開いた古典的名曲。ライブでやったら凄い盛り上がるにちがいない。
・Universe/子龍
癒し系インストゥルメンタル。ここで試聴できる。
・Radiohead/Everything In Its Right Place
radioheadの曲の中でいちばん好き。イントロの「てれれれ てーてーてー てーてー」ってところが流れてくるとキターって感じでぞくぞくする。大人しめのアレンジで、トム・ヨークの声の魅力を最大限に引き出しているところも良い。
・Book of Days/Enya
easy listeningなアーティストは大抵好きで、Enyaさんも例に漏れず大好き。かなり前の曲だったと思うが、最近映画の主題歌になったらしい。
そして。
最後にバトンを渡すわけですが、以下のみなさんにお願いします。
研究室の同僚がメインになっているのは、彼らについてより深く知りたい、から。
June 13, 2005
過去38年「学生就職志望企業ランキング」
http://www.president.co.jp/pre/20030818/001.html
日立って昔は人気あったんだ。今はいまいちなのに。
理系に関して言うと、バブル期の入り口あたりに境目がある感じ。
それまでは日立製作所、日本IBM、NECあたりが人気あった。
それからはNTT、ソニーあたりが人気になった。
NTTは1985年の民営化が切っ掛けか。ソニーはブランドが確立したのがそのあたりの時期ってことなのかな。
しかし、40年という長めのスパンで見ても、このランキングに載ってくる企業の顔ぶれがさほど変わっていないのに驚く。文系のはともかく、理系のものなら、30年前のものを「今年の結果だよ」って言われて見せられても、違和感はないな。
June 6, 2005
C#プログラミング: HTMLからタグを除去する
日曜日だけどヒマだったので、「もぶろげっと」のソースコードを開いてリファクタリングをしていた。リファクタリングというほど偉そうなものでもないんだけど、バックエンド部分の動作をもう少し軽くしたいと前々から思っていたので。
バックエンドのソースコードは概ねC#で書いてある。これを適当に解析してみると、HTMLからタグを除去する部分で割りと大きな処理時間を喰っているということが分かった。さあ、何とかしよう。
(まあ、本当はWebからリソースをダウンロードする部分や、文字コードの変換をしている部分のほうが時間を喰ってるんだけど。ダウンロードはほとんど相手サーバとのレスポンスタイムの問題だし、文字コード変換はライブラリに丸投げしているので手が出せず、自分で弄れる範囲で手っ取り早そうなのがそこだった。)
HTMLからタグを除去するのに、今まではこんなコードを書いていた。
private string RemoveTag(string article)
{
Regex regex = new Regex("<[^<]*>");
MatchCollection matchcollection = regex.Matches(article);//タグのリストをget
if(matchcollection.Count != 0)
for(int i=0; i
article = article.Replace(matchcollection[i].Value, "");
return article;
}
正規表現でタグをすべて抜き出して、String.Replaceで空文字列に置換していくというアルゴリズム。やってることをこうやって書き下しただけで如何にも重そうで富豪的って感じがする。String.Replaceは内部では文字列の一致検査をやってるやや重めの関数で、これをタグの数だけ実行するのは能率が悪すぎる。よく今までこんな関数使ってたな……。
さあ、どう書き直そうか。文字列ってデータ構造としては文字の配列だから、いちばん高速にするには先頭から末尾まで一回だけ走査して終わるというのが望ましいだろうと思われる。タグの除去をするにはbool型の状態を一つだけ、つまり今タグの中に居るかどうかだけを持てばいいので楽勝だ。じゃあ書いてみようか。というので下のようなコードが出来た。
private string RemoveTag2(string article)
{
char[] chars = article.ToCharArray();
bool isTag = false;
StringBuilder result = new StringBuilder();
for ( int i=0; i
if ( chars[i] == '<' )
isTag = true;
else if ( chars[i] == '>' )
isTag = false;
else if ( !isTag )
result.Append( chars[i] );
return result.ToString();
}
とりあえず、2つ関数が書けたので比較してみる。
今日の井原(このblog)のトップページのHTMLを使って、両方の関数でそれぞれ100回ずつ処理をさせて、その時間を出してみた。
RemoveTag 8.843
RemoveTag2 0.078 (sec)
うへ。桁が2つ違うのか。やっぱこの手の関数はローレベルなアルゴリズムを自分で書いた方が良いね。めでたしめでたし。
……とは行かないのだった。続く。
June 4, 2005
QMA Player
かなり簡単めな問題だと思うのだが、
2/3しか解けないのはちょっと情けないな。
flashが実によく出来てて感心する。
これくらい作れるようになりたいのう。
June 2, 2005
日立へ行くことにしました
その後、日立製作所に入社することを決め、推薦書その他の必要書類を先方に送付し、今週火曜日、正式に内内定を頂戴しました。
また、ヤフーには既に辞退の意志を伝えました。
というわけで、完全に進路が確定しましたことを御報告します。
June 1, 2005
まず、何かひとつ、モノを思い浮かべてください!
http://y.robinb.net/jp?SGbbodvaW-AXr-PsC6a6SWhWqRwv_MczH1p.rVIPfxfxlzWgPN
地味に凄い。予想外に当たるので驚く。
20Q.net Inc.とかいう、カナダのオタワ州にある会社が作っているらしい。
人工知能の分野で言うと、「エキスパートシステム」というのがこれに近いと思われるが、そのあたりの成果を何かしら応用しているのかもしれない。
