2015年4月30日木曜日

レバレッジが効くビジネスモデル（単位くらいは明確に　から）

http://blogos.com/article/110948/

単位くらいは明確に

細かい数字にこだわる人が多いのですが、あたしは（結論を変えない細かい数字には）全く興味がありません。

その一方、単位やケタ、すなわち「レベル感」を意識するのは、すごく大事なことだと思ってます。

たとえば、「あるビジネスに将来性があるか否か」みたいな話をする際、いわゆる起業家なら、「少なくとも数十億円、もしくは数百億円のビジネスになりえるか？」くらいのイメージで考えるでしょう。

でも、私が「いーんじゃないの？」「いけるんじゃないの？」って言う時に想定してるのは、「そのビジネスなら、大人ひとり十分に食べていけるでしょ？」って話であって、

具体的には「年収 500万円から 800万円くらいは稼げるはず」といったレベル感です。

人の話を聞くときは、この「どのレベルの話をしてるのか」について、相手の前提を理解してないと、トンチンカンな会話になってしまいます。

よく「起業なんて、千人、万人にひとりも成功しない」と言う人がいますが、

それって「一千億円規模の企業に育て上げられる確率」の話をしてるのか、「個人で事業を始めて、月商数百万円、年商で数千万円ほど稼げるようになる確率」の話をしてるのかによって、全く異なります。

★★★

なにかビジネスを始める時にも

・Facebook, Apple, Google みたいな世界規模のビジネスに育てたいのか

・楽天とか　DeNA みたいに、日本だけで一千億円以上を目指すのか

・数百億円くらいを考えているのか

・数十億円のビジネスを目指すのか

・数億円（月商で一千万円ちょい）の規模を想定しているのか

・数千万円（月商　数百万円）＝　個人事業＋αのレベル、なのか

の違いくらいは意識しておくべきだし、一緒に起業する仲間の間でも、目指してる事業のケタくらいは摺り合わせておいた方がいい。

なぜなら目指している事業規模がワンランク異なると、達成するために求められるモノや、必要になるコト、やるべきコトが全然違うから。

たとえば数千億円以上ってのは、レバレッジの効かないビジネスでは、まず実現できない。

「レバレッジが効く」とは、

・ゲームソフトやアプリのように、１回作れば同じモノが無限に複製できる

・言語さえ翻訳すれば、世界中で同じビジネスモデルが通用する（ウェブ or スマホサービス）

・ライセンスビジネスのように、提携他社を利用した事業拡大が可能

みたいな事業です。

レバレッジを効かせずに数千億円の事業を実現するのは超大変なことで、通常は、代を超えた企業の成長が必要になります。（伝統的なメーカーみたいにね）

だから、もし一代でそういう規模を目指したいなら、最初から「このビジネスってレバレッジが効くか？」という視点で考える必要がある。

でも数百億円のビジネスなら、必ずしもレバレッジが効かなくてもいい。すると、ビジネスモデルの幅は相当に広く考えられる。

と言っても数百億円にするには、「大規模オペレーション」は不可欠です。

工場で作るとか（工場が自社工場である必要はないです）、コールセンターで処理するとか、フランチャイズで展開するとか。

そういう「大量生産ライン」なしで、売上げを数百億円に乗せるのは苦しい。

さらに下げて売上げが数十億円でいいなら、レバレッジが効かないビジネスで、大規模オペレーションにも乗り出さず、付加価値の高い製品をカスタムメイドで提供する、って形でも達成可能になる。

スゴク個性的な車を、ほとんど手作りで作って売るとか、

コンサルティングみたいに人間がアドバイスする事業も、レバレッジは効かないし大規模オペレーションも難しいけど、数十億円なら（単価も高いので）十分に達成可能。

つまりこのレベルの目標でいいなら、プロフェッショナルファーム的な組織の作り方でも実現可能だし、大都市のみでの展開とかでも達成可能。

慣れない分野に乗り出したり、「自分たちとは価値観の違う人達」を組織に抱える必要がないので、精神的にはかなり楽です。

とはいえ、それでも数十億円の規模を目指すには、多くの場合、組織の中に複数のリーダーが必要になります。だから、仲間以外からも優秀で信頼できる人材を確保できないと実現できない。

これが、「売上げは数億円でいい」となれば、リーダーは自分だけとか、起業メンバーの２名だけ、とかでも実現可能になる。

自分の好きなビジネスを、自分の好きなやり方で続けながら、達成可能な範囲の目標です。

さらに（すでに起業というレベルではなく）あたしがよく勧めてる「自由に生きるために自分で稼ごう！」的な話になると、売上げは数千万円ほどでいい。

これなら得意な分野でマーケット感覚を発揮し、初期投資を最小化してほとんどリスクなくスタートできるし、試行錯誤しながら市場と失敗から学ぶ力さえあれば、半分くらいの人は成功できます、みたいな世界になる。

「ちきりんビジネス」なんて、まさにコレです。

というわけで、起業する時や自分で市場に乗り出す時、細かい数字はどうでもいいけど、とりあえず「どのレベルの成功を目指してるのか」くらいは意識しておくといーんじゃないかと思います。

そんじゃーね。

2015年4月27日月曜日

元Amazon社員が明かす、”最強の捕食者“Amazonのビジネスモデルとは？

Amazon.comの2012年の全世界総売上高は610億9300万ドル(約5兆9000億円)と、世界最大のネット小売業者の地位を不動のものにしています。しかしAmazonは、巨額の売り上げにもかかわらず、毎年赤字決算を出すことで有名であり、それ故に投資家から絶大の信頼を得ていて、また、盤石の地位を築き上げているといいます。

Amazon and the "profitless business model" fallacy — Remains of the Day
http://www.eugenewei.com/blog/2013/10/25/amazon-and-the-profitless-business-model-narrative

2013年10月24日にAmazon.comが第3四半期(2013年7月から9月)の決算を発表しました。発表内容によると、売上高は前年同期比24％増の170億9200万ドル(約1兆6600億円)にも関わらず、純損失4100万ドル(約40億円)だとのこと。本業のネット小売業だけでなく、クラウドサービス「Amazon Web Services(AWS)」などが絶好調のAmazonによる赤字決算の発表は、ウォール街では見慣れた光景であり、投資家のAmazonに対する信頼はまったく揺らぐことがないことは、堅調な株価が示すとおりです。

1997年から2004年にAmazonで働いたEugene Wei氏は、同社のビジネスモデルを古典的な「固定費型ビジネス」であると表現しています。これは、いったん十分な売り上げを達成すると、収入が固定費ベースを超えて利益構造に転換するもので、Amazonはこれまでに何回も固定費ベースというハードルを越えてきました。

WeiさんがAmazonに加入した早い段階で、いつ収入が固定費ベースを超えて利益を生むかを予測することは可能で、投資を積極的に行うか、そのペースを緩めるかによって転換期を調整することができたといいます。確かに、AmazonではKindleのeBookに代表されるように、売ることで赤字になる商品も扱っています。しかし、巨大な電子機器のように送料としてかかるコストが大きなアイテムであっても、長い時間をかけて修正が行われ、意図的にロスリーダー(目玉商品)として売っている物を除けば、ほとんどの商品が利益を生み出しており、また、マーケットプレイスのように巨額の粗利益を稼ぐプラットフォームを持つなど、収益構造は万全です。

では、それほどまで利益を生むビジネスがあるのに、なぜAmazonが四半期決算のたびに赤字であるとの発表を行うのか。その理由をWei氏は「Amazonには無限の野心があるからです。Amazonは世界中の小売店を飲み込みたいのです」と語ります。

By Alexandre Duret-Lutz

Amazonには壮大な目標があり、これまでより大きな規模のビジネスを行うために投資をするという決断をし続けてきました。例えば、純粋なソフトウェアビジネスを行っていれば、戦略的な固定費はより小さなもので済んだはずですが、「世界中のすべての顧客に素早く商品を届けるビジネス」を育てるために必要とされる資本を有するのは、世界でもほんの一握りの企業に限られます。

Amazonは、送料をできるだけ安くし、商品をできるだけ早く届けることが、顧客の満足度を高め次の取引につながることを早い段階で理解しました。そのため、何十億ドルもの巨額の費用を世界中の物流センターの構築につぎ込んできたのです。Wei氏がAmazonに加わったとき、アメリカに物流センターは一つしかありませんでしたが、今では12箇所に増やされ物流網が築き上げられています。

By Scottish Government

Wei氏は、新しい物流センターの建設や新しい国への進出をやめれば、Amazonは今すぐにでも四半期収益を簡単に黒字にできると確信しています。それは、Amazonがまだアメリカ国内で本を売るビジネスをしていて、ちょうど彼が加わった1994年の時点でさえ可能だったといいます。しかし、ジェフ・ベゾスCEOはそのような手法を決してとりません。「ベゾス氏、そしてベゾス氏が率いているAmazonは、食物連鎖の頂点にいる捕食者であり、決して狩りをやめることはないでしょう」とWei氏は話します。

よくAmazonの"利益を出さない"ビジネスモデルについて「flip the switch(急反転)」が最終目的だとする主張があります。すなわち、世界中の小売店をたたきつぶし最後まで生き残ったAmazonは、ある日突如として価格を全面的に上げる、という推論です。しかし、Wei氏はこれを邪推だと一蹴しています。その理由は、Amazonのコアビジネスであるネット販売は、各取引ごとに時価レベルで利益を生み出せるのであって、スイッチを切り替えるまでもなく、取引高が成長し物流センター建設の固定費を超えるときまで待つだけで利益を上げるには十分だからです。

このような誤解を生むのは、Amazonが、例えば「Amazonプライムの加入者の人数は？」「Kindleはどれくらい売れたのか？」「物流センターへの設備投資額はいくらか？」といった質問に対する回答を、ファイナンシャルレポートで一切出さないことが原因です。しかし、このようなAmazonの姿勢は、GoogleやAppleといったハイテク企業に特有のものであり、ハイテクビジネスの経営を誰よりも知るのは投資家ではなくハイテク企業自身であるというプライド故に仕方のないことかもしれません。

しかし、日用品を売るというAmazonのコアビジネスが本質的にマージン(利益)の小さいビジネスである、というのはベゾスCEOも百も承知のこと。どんな手法をもちいたところで、Appleのハードウェアビジネスのようなマージンを達成することは不可能です。その結果、AmazonがクラウドサービスのAWSに乗りだし巨額の投資を行いライバルのIBMを蹴落として米国中央情報局(CIA)とコンピューティングサービス契約を締結し、さらに「Login and Pay with Amazon」サービスをひっさげPaypalに勝負を挑もうとしているのは、Amazonの無限の野心からすれば至極当然のことだと言えます。

By JD Hancock

Amazonが巨額の投資を続けるのをやめることを望む投資家もいます。彼らは、ライバルはもう蹴散らした、今こそ転換期だと考えています。しかし、1982年当時最大の小売業者であったシアーズは、その9年後、ウォルマートの半分の規模になりました。スマートフォン市場を切り開いたブラックベリーは消滅寸前です。Amazonが競争(レース)をやめることを望むのは、ナンセンスです。

Wei氏は、Amazonを「ウサギでもあり亀でもある」と例えます。Amazonは非常に忍耐強く、他の会社のように遊ぶこともなく、失敗を繰り返してもへこたれません。しかし、ビジネスチャンスをかぎ取れば、誰よりも早く疾走することもできます。そして、競争相手を過酷な環境に引きずり込み勝負をします。Wei氏は仮に自分がAmazonのライバルであれば、四半期ごとに赤字を垂れ流すのを恐ろしいシグナルと見なすだろうと言います。彼は「それは、Amazonがレースの舞台を空気の薄い高地へ引き上げる準備をしているということであり、小売競争は今後、さらにハードなものになるだろう」と予想しています。

異種混合学習、リアルタイムへと進む機械学習　特集「一歩進んだ機械学習」（前編）2014.06.05

http://business.nikkeibp.co.jp/article/bigdata/20140604/266216/

データに含まれる複数の規則性を発見する、リアルタイムに学習し常にモデルを更新する…。従来の機械学習の弱点を解決すべく、一歩進んだ手法の採用が広がる。

　「項目数が4600くらいあり、人手で計算するのは大変」（大林組技術本部企画推進室の岩波洋部長）

　大林組はNECと共同で、エネルギー需要予測システムを開発し、実験を進めている。予測には、NECの「異種混合学習技術」を利用している。データのなかに潜む複数の規則性を発見、データが参照すべき規則を切り替える一歩進んだ機械学習である。

　2010年に完成した大林組技術研究所本館は、省エネルギービルである。省エネのための様々な仕掛けがある。例えば、従業員の在／不在により照明や空調を調節する。太陽光発電を利用して環境対策を講じ、蓄電池や蓄熱槽を設置して安い夜間電力を活用して低コスト化を図っている。

　このビルで、大林組は蓄電池や蓄熱槽を効率的に使うため、エネルギー需要を予測する実証実験をNECと共同で取り組んだ。多くのセンサーを利用しており、データの項目数は合計すると約4600に上る。この大量のデータを分析してエネルギー需要を予測するのは、スキルの高いデータサイエンティストでもかなり骨が折れる作業だ。

　そこで採用したのが、異種混合学習技術である。データから複数の規則性を発見するとともに、その規則性に基づきデータを分割する一歩進んだ機械学習である。

一般的な機械学習と異種混合学習の違い

[画像クリックで拡大表示]

　一方で、リアルタイムの機械学習の実用化が進んでいる。住友精密工業とPreferred Infrastructure（東京都文京区、PFI）、ブリスコラ（東京都港区）は、ビニールハウスのデータ異常検知の自動化を実現した。PFIとNTTが共同で開発したオンライン／リアルタイム分散機械学習基盤である「Jubatus」（ユバタス）を利用している。ビニールハウスの温度などの環境を適切に保つため、温度や湿度、ボイラーの状況を測るなどのセンサーを設置。それらのデータをリアルタイムで収集し、異常があれば関係者に通知するというシステムを構築した。

　ビニールハウスに異常があるかどうかは、温度のしきい値を設定して、それを超えたら異常というように単純にはいかない。個々のビニールハウスの設備といった環境や季節などによって、適正な温度が異なるからだ。

　そこでリアルタイム機械学習を採用した。個々のビニールハウスの年間の観測データを学習させて、それから逸脱した状態（異常）を検知するシステムである。学習によって、異常のしきい値は自動的に設定され、運用開始後も常に学習を続けて分析モデルを最適に維持する。

　リアルタイム機械学習は、機器などの異常検知やクレジットカードの不正使用の検知など、緊急性が高い用途に強い。

人にはできない発見をする

　機械学習は、コンピュータの計算能力によって、分析モデルや予測式などを作り出す技術である。通常のデータ分析では、データサイエンティストが予測式などを作成し、実際にデータを分析する。相関が見つかるまで、この作業を繰り返す。分析ツールを使えば、分析モデルの作成が効率化できる。しかし、人が「相関があるのでは」と考えられるデータの種類は限られる。

　機械学習はこの繰り返し作業を自動化してくれる。「人では見当もつかないようなルール（予測式）などを、コンピュータの計算能力で見つけ出せる」（日本アイ・ビー・エム東京基礎研究所数理科学＆レジエンス工学担当の渡辺日出雄部長）という特徴がある。

機械学習の仕組み

　IBMでも様々な用途で機械学習の研究を進めており、その1つにヒヤリハット状況の識別がある。自動車のドライブレコーダーのデータを分析し、事故の一歩手前のような状況を識別する技術である。この識別ルールを人が作るのは難しいが、機械学習によってヒヤリハットの識別に有効な特徴を抽出する手法を開発した。

　不良品のチェックなど、熟練した人ならばごく普通にできることを、データ分析モデルとして作り上げることは容易ではない。熟練者に聞いても、判断基準を明確に答えられない場合が多く、データにすること自体難しいからだ。

　AI（人工知能）をはじめ、数十年前から人を“まねる”技術の開発は進められてきた。ただ、広く普及している状況ではなかった。ここにきて、IoT（Internet of Things）といわれるように、多くの機器がインターネットにつながり、センサーなどの大量のデータが容易に収集できるようになってきた。一方で、低コストでコンピュータの処理能力を手に入れられるようになった。そのため、機械学習が身近になり、ビッグデータの分析のニーズの高まりと相まってその利用が急速に進んでいる。

自然言語処理に新風を巻き起こしたWord2Vecとは何か　「イノベーションの予兆」　第4回（最終回） 2014.11.12

http://business.nikkeibp.co.jp/article/bigdata/20141110/273649/

言語データの分析と応用のために自然言語処理と呼ばれる分野で長年研究が行われて来た。同分野が昨年から大きく沸き立っている。米グーグルの研究者であるトマス・ミコロフ氏らが提案した手法「Word2Vec」が、いくつかの問題について従来のアルゴリズムよりも飛躍的な精度向上を可能にしたのだ。

　この手法によって得られるベクトル空間には、今まで定量的に捉えることの難しかった言葉の「意味」を極めて直接的に表現しているかのような性質が認められている。今年9月、当社がスポンサー参加した自然言語処理系の研究発表会「NLP若手の会第9回シンポジウム」でも、多くの研究がWord2Vecに関連したテーマについて取り上げていた。今後、意味解析、文書分類、機械翻訳など様々な分野でWord2Vecの応用が期待されている。

「意味ベクトル」の驚異的な性質

　Word2Vecは、その名前の表す通り、単語をベクトル化して表現するする定量化手法である。例えば日本人が日常的に使う語彙数は数万から数十万といわれるが、Word2Vecでは各単語を200次元くらいの空間内におけるベクトルとして表現する。

　それぞれの単語を200個の要素の組み合わせとして表現するため、このような手法は「分散表現」とも呼ばれている。単語からベクトル表現を作り出す研究は以前にもあったが、それらとの違いは、そのベクトルがただの数学的な存在として以上に、複雑なコンセプトを表現していることにある。実例を見てみるとその可能性が実感できるだろう。

・「男性－女性」を「おじ」や「王」に足すと、「おば」や「女王」になる。つまりこの差分は「男性と女性の違い」を表現している

・「フランス」－「パリ」＋「東京」＝「日本」などの結果も得られる。「フランス－パリ」は、「その都市を首都とする国」を表現している

・さらにユニークな事例としては、「The Matrix（映画）」-「Thoughtful（考えぬかれている）」+「dumb（馬鹿っぽさ）」＝「Blade II（別の映画）」という結果も報告されている

　このように、本来であれば非常に複雑な表現を定量化されたベクトル表現化することが可能になる。その結果、ここに示したような問題の解決において、以前よりも飛躍的な精度向上が実証されている。

Word2Vecを可能にしたもの

　実はWord2Vecは、非常に単純な前提をもとに構築されている。それは「同じ文脈の中にある単語はお互いに近い意味を持っている」というものである。「分散表現」とは、近年ディープラーニングなどの分野でも深く研究されている人工ニューラルネットワークの研究で提唱された考え方で、Word2Vecも人工ニューラルネットワークの研究から生まれた。

　一方で、Word2Vecで使われている手法は、他の手法に比べその内部構造が非常に簡略化されている。ある単語が与えられたときに、近く（前後5―10単語くらい）に出現する他の単語を当てる、という問題の解を、与えられた文章中の単語全てに対して人工ニューラルネットワークに学習させる。似た意味の言葉はお互い近くにあらわれる可能性が高いため、学習を行っていく過程で、徐々に近しい方向のベクトルになっていく。これは本来であれば非常に計算量の多い問題だが、ミコロフ氏らの研究により、その計算効率も劇的に向上されたのである。

簡単に使えることが大きな長所

　この非常に面白い性質と、計算効率の高さから、この研究には昨年の発表以来非常に強い関心が寄せられ、実行プログラムも公開されている。C、Python、Javaなど、様々な言語での実装が開発され、多くの研究者に応用されている。

学習に使われる文書量によって計算に多少の時間はかかるものの、文章をプログラムに渡すだけで動作させることができるため、基本的なプログラミングスキルを持っていれば誰でも簡単に動かすことができる。

　その結果、ミコロフ氏自身が大量の関連論文を書いているだけでなく、自然言語処理の分野全体が沸き立っている。応用に向けた研究はもとより、なぜこの手法によって得られたベクトルがここまでの表現力を持っているのか自体に関する研究も盛んだ。

私自身が使ってみて実感したイノベーションの予兆

　Word2Vecの実用レベルでの本格的な応用はこれからである。応用研究の一つとしては、単語だけでなく、より長い文章のベクトル表現化などの研究が行われている。この研究が成功すれば、文書の分類問題への応用などが考えられ、ニュースサービスなどへの応用が期待される。複数言語間でのベクトルの関係性についての研究も拍車がかかっているようだ。機械翻訳への応用において、翻訳精度の大きな向上への期待がかかる。

　本誌10月号に掲載された「ウエアラブルが商品になるまで　日経BP社の記事データから見える関心動向」という記事の作成に関わった際には、私自身Word2Vecを応用し、「ウエアラブル」という表現がどのような文脈で使われているのかを分析した。各年代における単語の使われ方の変遷を表すための新しい手法をごく簡単に開発することができた。

　今後さらに思いもよらないような応用例が現れてくることは間違いない。ディープラーニングによる画像解析の成果などと同じく、今後のビッグデータ解析における技術的イノベーションの予兆と見ることができるだろう。

※柴田暁氏の「イノベーションの予兆」は今回が最終回です。

機械学習の魅力とワナ　2015.03.16

http://business.nikkeibp.co.jp/article/bigdata/20150310/278519/

ビッグデータという言葉が生まれて数年が経った。最近では、「ビッグデータから新たな価値を創出」といった類の事例報告が毎日のように紙面を賑わすようになってきている。これは、多くの企業や自治体で、具体的なビッグデータの活用が進んでいることの表れである。そして、これらの多くの事例で利用されている技術に機械学習がある。本稿では、機械学習の魅力とワナを紹介し、今後の展望を述べる。

ビッグデータの花形技術：「機械学習」

　機械学習とはもともと、人間が経験から学習する過程をコンピュータ上で実現することを目指した、人工知能の主要な研究分野である。現在では、数値やテキスト、画像、音声などの様々なデータから、規則性やパターン、知識などを発見し、現状の把握や将来を予測するのに利用されている。人間が明示的にプログラムするのではなく、データからコンピュータが自動的に見つけ出すところがこの技術のポイントである。

　機械学習は一般的に、同じ種類のデータであれば、データ数の増加に伴い精度を向上させることができる。従来はデータ数も少なく実用上十分な精度が出なかったため、適用範囲も限定されていたが、膨大な数のデータを活用できるビッグデータ時代にあって、まさに花形の技術として活用が進んでいる。

　以下に、機械学習の魅力をわかりやすい事例で2つ紹介する。

コンピュータ将棋：機械学習で名人に迫る

　近年のコンピュータ将棋は、人間のプロ棋士に肩を並べるほど強くなっている。なぜこれほどまでにコンピュータ将棋は強くなったのか。答えは機械学習の適用にある。

　コンピュータ将棋は、将棋の強い人の大局観や経験に基づくノウハウをプログラムすることで強くなってきた。しかし、主流であったこの方法とは全く異なるやり方がコンピュータ将棋にブレイクスルーを起こした。それが、機械学習を用いた将棋ソフトである（図1）。

図1　コンピュータ将棋ソフトの進化

　このソフトは、プロ棋士の棋譜データ（初手から終局までの着手を記したデータ）から、局面の評価関数を学習させる。局面評価関数とは、ある局面における優劣を点数で表すための関数であり、いわば将棋の強さの肝である。近年の局面評価関数は、6万局を超える棋譜から１億にもおよぶ最適なパラメーターを自動学習している。

　機械学習を用いた将棋ソフトは、将棋の高段者が考案したわけではない。そうでなくても、プロ棋士に比肩する将棋ソフトを作れたことは、機械学習の大きな魅力を示している。

ヘルスケア：機械学習で生活習慣病の発症を予見する

　次に、生活習慣病の発症リスクの予測に機械学習を適用した事例を紹介する。

　多くの健康保険組合において、医療費の疾病別支出に対する生活習慣病の占める割合は非常に高く、生活習慣病の予防は、従業員の健康推進に加えて、医療給付金抑制のための重要な課題となっている。我々は、将来の発症リスクを高精度に予測することができれば予防に役立つと考え、実証実験を行った。

　実証実験では、富士通の従業員26,000名の過去3年分の健康診断データとレセプトデータから、1年後の糖尿病の発症リスクを予測した。機械学習を適用することで、極めて高い精度で予測できることが分かったが、別の観点でも非常に興味深い結果を得た。

　厚生労働省「標準的な健診・保健指導プログラム【改訂版】（平成25年4月）」によると、血糖検査に関する受診対象の基準値は、空腹時血糖値が126mg/dl以上、HbA1c（ヘモグロビンA1c）値が6.5％以上と定められている。しかしながら、これら2つの項目だけを用いた場合、いくらチューニングしても実用上十分な精度を出すことはできなかった。

　我々は、糖尿病とは一見関係のないと思われる他の健康診断項目やレセプトデータを利用することで（図2）、これら2つの項目を使った場合よりも予測精度を25％以上も向上させることに成功したのである。医学的な知見に基づいているわけではないが、一見関係のないと思われる項目を組み合わせることで、予測精度が向上することは機械学習の魅力と言える。

図2　糖尿病の発症リスクの予測

機械学習のワナ

　しかし、現在の機械学習は万能な技術なのであろうか。データさえあれば、機械学習を適用することで必ず十分な効果をあげることができるのであろうか。筆者の答えはNoである。実際、オープンソースの機械学習ライブラリを使ってみたが全く精度が上がらない、といった声もよく聞かれる。

　技術的な観点から見た場合、これにはいくつかの理由がある。

　まず、機械学習の分野にはNo Free Lunch定理という有名な定理がある。これは平たく言うと、どんな問題やどんなデータに対しても最高の精度を出せる万能な機械学習手法は存在しないという定理である。

　機械学習と一口に言っても様々な手法が存在し、問題やデータによってそれぞれの手法の精度はまちまちなのである。機械学習の適用で陥りやすいワナは、ある特定の機械学習手法だけを適用するのは極めて危険だということである。機械学習で最高の精度を手に入れるためには、様々な手法を検証してみる必要がある。

　次のワナは、機械学習の適用で最も重要な作業の1つである特徴選択にある。特徴とは、機械学習に入力するデータ項目のことであり、この特徴をどう選ぶか、どう作るかによって機械学習の精度は大幅に変化する。一般的には、データベースのデータ項目や時系列データそのものを特徴として機械学習に適用しても精度が出ない場合がほとんどである。これは機械学習の適用で頻出するワナである。先生が生徒の能力を高めるために良い教材を与えるように、機械学習にもよい特徴を与えなければうまく働かないのである。

　機械学習の手法や特徴の選択は試行錯誤を伴い、一般的に非常に時間がかかる。また、高度なノウハウや大規模な計算機環境が必要とされる場合も多い。機械学習の適用で行き詰った場合は、専門のコンサルティングを受けるのも1つの手といえる。例えば、富士通は、ビッグデータ分析の専門家であるキュレーターが上記の問題解決を行う「データキュレーションサービス」というコンサルティングサービスを提供している。

機械学習の今後

　今後、ビッグデータは増加の一途を辿り、機械学習のビジネス適用がさらに加速することは間違いない。現在は過去データに機械学習を適用することで成果が見込めることが分かった、という実証的な事例が多いが、今後はビジネスの現場にどんどん機械学習が入り込んでいき、機械学習の開発というより運用に重点が移っていくと考えられる。

　また、機械学習自体の技術も発展してきている。脳機能を模したニューラルネットワークに大きな進展があり、並列計算技術などを活用することで、従来は困難であった多層のニューラルネットから学習することを可能にした深層学習（Deep Learning）という技術が誕生している。深層学習は、画像認識や音声認識などのコンペティションで桁違いの精度を出しているだけではなく、特徴選択自体をコンピュータが行う可能性を示している。ビジネス適用の事例も出始めており、ここ3年のうちには、画像認識や音声認識のみならず広い分野での活用が本格化すると筆者は見ている。

参考資料

FUJITSU Intelligent Data Service データキュレーションサービス
　http://jp.fujitsu.com/solutions/convergence/service/curation/

岡本青史

株式会社富士通研究所
ソーシャルイノベーション研究所
インテリジェントコンピューティング部
主席研究員

1991年、株式会社富士通研究所入社。機械学習や推論、情報検索等の研究開発に従事。2011年、富士通株式会社に異動し、ビッグデータ分析業務に従事。2014年、富士通研究所に復職後、人工知能の研究開発に従事。

inシェア

富士通株式会社は、1935年6月20日に設立されました。通信システム、情報処理システムおよび電子デバイスの製造・販売ならびにこれらに関するサービスの提供をしています。
強いインフォーメーション・テクノロジーをベースに、高性能・高品質なソリューションを創出、提供します。
http://www.fujitsu.com/jp/

Amazonのワンクリック決済システムが自サイトでも使える「Login and Pay with Amazon」発表

http://gigazine.net/news/20131009-login-and-pay-with-amazon/

Amazonにログインした状態ならワンクリックで支払いができ、何かを購入する度に長々と自分の名前・住所・電話番号・メールアドレス・支払い方法などを入力しまくる必要がなく、他のページに飛ばされることも無くなるという新しい仕組み「Login and Pay with Amazon」が発表されました。

Merchant Account, Merchant Services, Shopping Cart - Amazon Payments
https://payments.amazon.com/business

Amazon Media Room: Press Releases
http://phx.corporate-ir.net/phoenix.zhtml?c=176060&p=irol-newsArticle&ID=1862641&highlight=

実際にAmazon Paymentsのサービスを使うとこんな感じになります。

Login and Pay with Amazon - YouTube

これまでのオンラインショッピングは、商品をカゴの中に入れて……

細かい情報を入力。

さらにはカードの情報や氏名・住所・電話番号・メールアドレスなどなど多くの情報を入力しなければなりません。それが面倒なので決まった1つのサイトでのみオンラインショッピングを行う、という人も多いはず。

そんな面倒なオンラインショッピングを劇的に簡単にしてくれるのがLogin and Pay with Amazon

「Pay with Amazon」ボタンを押すだけで商品の購入が可能になります。

ウェブサイト上にはこんな感じで「Pay with Amazon」ボタンが表示されるようになります。開発者は既存のウェブサイト上にLogin and Pay with AmazonのウィジェットとAPIを埋め込み、システムを統合するだけでOK。

オンラインショップはユーザーがAmazonアカウントに登録している支払い情報に基づきお金が支払われ……

ユーザーはワンクリック(もしくはAmazonにログインするためにプラス数クリック)のみで商品購入が可能になります。

このサービスは通常のウェブサイトはもちろん、KindleやiOS、Androidなどを搭載したスマートフォンやタブレットでも利用可能。

これにより顧客は大量の情報を入力しまくる必要がなくなり、オンラインショップはより多くの顧客との関係を築くことが可能になる、とのこと。オンラインショップ側が得られる顧客情報は氏名・メールアドレス・郵便番号。

「Amazonには現在アクティブに使用されている顧客アカウントが2億1500万以上存在する。eコマース企業はLogin and Pay with Amazonを利用することで、Amazonの持つ何億ものユーザーを自身の顧客にすることが可能で、Amazonアカウントを持った顧客たちはオンライン上でショッピングを行う際に、Amazonの支払い情報を利用して安全かつセキュアにショッピングが可能となる」と発言するのはAmazon Paymentsの副社長であるTom Taylor氏。

eコマース企業がLogin and Pay with Amazonでの支払いを利用する場合には、取引価格の2.9％＋1度の取引ごとに0.3ドル(約29円)を支払う必要ありで、それ以外に追加の費用は無し、取引量の多い場合には減額もアリとなっています。また、この支払システムを利用した購入者はAmazon.comでの購入者と同様にA-to-z保証により保護される、とのことです。

登録: 投稿 (Atom)