Microsoft Research Internship アルムナイ Advent Calendar 2020 17日目

こんにちは!Microsoft Research Internship アルムナイ Advent Calendar 2020 17日目を担当します,京都大学 博士後期課程3年の稲熊 寛文です. 音声認識と音声翻訳の研究をしています. 私は去年(2019年, D2時)レドモンド本社で音声認識のトピックでインターンに参加させていただきました.

adventar.org

目次

選考過程(2018年12月)

もちろんインターン環境自体は素晴らしいのですが,オファーをもらわないと始まらないので,自分がそれまでにしたことをシェアしたいと思います. 私は博士課程の間に海外企業のインターンに行くのが目標でした(それが社会人博士を選択しなかった理由の一つでもありました). もともとMSという会社自体にはこだわりはなかったのですが,自分がインターンしたグループでは毎年インターンが論文として成果をあげており,研究内容も自分の好みに合っていたので,もし行ければ自分も3ヶ月で良い成果が出せるんじゃないかと思って応募を決意しました. 過去に本社でインターンした人は特にHCIの分野で多いと思いますが,speechの分野ではいなかったので,コネもノウハウもない状態でスタートしました.

2018年12月(D1)にspeechの某国際会議に参加し,ちょうど夏のインターンを募集していた時期だったので,現地でMSのマネージャーの人に自分を売りに行きました. 自分のポスター発表を見に来てもらうようお願いし,またバンケットで隣に座るという図々しさを発揮し,2019年1月頃に見事インターンのオファーを獲得しました(もちろんその後電話インタビューもありましたが). この時点で特に業績があったわけではなく,また人見知りなのでかなり勇気を振り絞ったのを覚えています. でもこの行動が2年後の自分を大きく変えました.

また,これがきっかけで鎌倉さんと知り合うことができ,この年のMSRA PhD fellowshipへ応募することになりました. ちょうどインターンに行く前に第一選考の書類を提出しました(体験記).

インターン期間中の思い出(2019年7月-10月)

D2の7月-10月の間にインターンに参加しました. 私はWindowsが好きではないのですが,やっぱりWindowsで研究しないといけないのかと思っていたところ,幸運にも私のためにLinuxマシンが用意されていました. まず最初に銀行口座の開設やsocial security numberの発行など,簡単ですがアメリカでは初めてのことだらけで疲れました.

短いインターン期間中でしたが,オフィス移動を経験しました(最初の1ヶ月はベルビュー,残りの2ヶ月はレドモンド本社キャンパス). 宿は本社キャンパスから徒歩10分くらいのところの新築のアパートを用意してもらいました. めちゃめちゃ綺麗で,部屋にドラム式乾燥機付き洗濯機があったのが特にありがたかったです.

ベルビューへはMSのシャトルバスまたは市バスで片道30分くらいで通い,本社に移ってからは毎日ペニーで通っていました. 社員証があればシアトル内のバスはすべて無料でした! 本社に移ってから,DJが突然現れてビュッフェスタイルの食べ物が並べられたり,アルコールが夕方に並べられるようなイベントが多々ありました. また社内イベントでクルージングや社内総会にも参加したり,休日にマウントレーニアへ登ったりもしました.

生活リズムとしては,朝早く行く日もあれば昼過ぎに行く日もありました. 私は夜型なので,午前2時くらいまでオフィスにいました. Uber Eatsのおかげで生き延びることができました. 土日のどちらかは観光に使い,どちらかはオフィスで研究していました. 人がいない時間は電気が暗めに設定されるため,目が悪くなりました.

MSでは有給のインターンは12週間と決まっており,それとは別で2週間のオフを任意の期間に挟むことができます. 私は最初の1週間を国際会議(オーストリア)への参加に使いました. 残りの1週間はどこか旅行に行こうと思ったのですが,9月頃にPhD fellowshipの第一選考を通過したとの連絡をいただき,北京への出張で消えてしまいました(笑)

PhD fellowship 二次選考(2019年10月)

10月頃,インターンの成果をまとめている時期にfellowshipの二次選考のためシアトルから北京へ飛びました. 行きの飛行機ではずっとプレゼンの練習をしていました. 初めての中国だったのですが,鎌倉さんにサポートしていただき,無事にインタビューを終えることができました. バタバタしましたが,その甲斐あってかこの年のfellowshipを受賞いたしました. その後一泊二日ですぐにシアトルに戻り,急いでfinal talkの準備をしました.

研究内容

オンラインストリーミング音声認識モデルのレイテンシ削減に関する研究を行いました. インターン中に知り合った方々は分野で有名な人ばかりで,人脈が確実に広がったのを感じました. メンターとは毎日議論をし,英語力も鍛えられたと思います. また,インターン期間中は毎週のグループミーティングに参加していたため,社員がどうやって論文になる成果を出すのか近くで見ることができ,研究のセンスがかなり磨かれました. 周りに日本人がいない環境を選んだため,バイタリティも鍛えられました. 最後の週にはfinal talkを1時間ほどしました. 実際に一緒に研究をした人は4人でしたが,多くの人が集まってくださり,毎年インターンにかけている期待の高さが伺えました.

最終的にインターンでの成果をICASSP2020に投稿し,オーラルで採録されました(パテントにもなりました). 発表するセッションはかなり目立てるところだったのですが,結局COVID-19でオンライン開催になってしまいました. ですがこの記事を書いた本日,この論文でIEEE Signal Processing Society (SPS) Japan Student Conference Paper Awardを受賞しました. さらに,帰国後にインターン成果の発展で2本論文を書くことができました. 同じグループに他に2人インターンがいましたが,彼らも成果を論文としてpublishしました. publish率100%の最高の環境です.

また,インターンの早々の時点でリターンオファーをもらっていたのですが,こちらもCOVID-19で開始日が1年延期された後,日本からは参加できなくなり中止になりました. すぐにシアトルに戻ってくると思って観光地を制覇しないようにしていたのですが,まさかこんなことになるとは... もう一度インターンに行っていればその後もフルタイムで働くことを考えていたので,非常に残念でした. 現在,MSでのインターンはリモートになっており,アメリカまたはカナダ在住でないと参加できないようです (ですので2021年は日本からは参加できません). 自分がインターンで得られたものがリモートではとても代替できないほどあまりにも大きすぎて,現状に対して本当に残念に思います.

おわりに

MSでのインターンは確実に僕の人生を変えてくれたので,現在博士課程の方(D1の方は来年?)やこれからなる人にはぜひ候補としてオススメしたいです. 私は博士課程修了後は違う会社に行きますが,Microsoftは縁があったらまた働きたい素晴らしい会社です.

 

 

Microsoft Research Asia Ph.D. Fellowship 2019 体験談

この記事では,光栄にも昨年のMSRA Ph.D. Fellowhship 2019でwinnerに選んでいただいた際の,winnerに至るまでの経験と自分なりに工夫した点などをシェアできればと思います. 僕は研究したいという気持ちに火がつくのが非常に遅く(M1の秋),応募時にバリバリの研究成果があったわけではないので,いろんな人の応募するきっかけになれば嬉しいです. ただし,自分なりに考えて行ったことですので,あくまで一例として捉えてください. 合否の結果に関わらず,しっかりと準備してプロポーザルを書くことは今後の研究者としての人生できっと役に立つはずです.

Fellowship自体の紹介や,winnerになるとどんないいことがあるかなどはこちらの素晴らしい記事がありますので,そちらをご覧ください.

目次

自己紹介

京都大学 情報学研究科 知能情報学専攻 博士後期課程3年の稲熊 寛文と申します. 普段は音声認識と音声翻訳の研究をしています. 詳細なプロフィールはこちらからご覧ください. 僕はD2の6月の時点で応募しました(D1の時点ではFellowshipの存在を知らなかったと思います). D1から応募できるので,要件を満たしている人はぜひ応募しましょう.

選考プロセス概要

1. 一次選考: 書類審査

形式自由のプロポーザル(英語)による書類審査があります. 数年前までスライドを使ったビデオの提出があったようですが,昨年は書類のみでした. 用意すべき資料は以下の通りです.

  • プロポーザル

    • 学振と違ってテンプレートがないため,自分自身非常に試行錯誤しました. 内容としては,自分がこれまで行ってきた研究や,これから研究したいテーマを書きます. しかし,学振と違って読み手は(おそらくリサーチャーで)自分の分野に詳しい可能性がずっと高いと思います. なので,できもしないような壮大すぎることを書いても見抜かれますし,今の技術でほとんどできてしまうようなことを書いてもインパクトがありません. 今回はこの部分の書き方にフォーカスしたいと思います.
  • 推薦状

    • 応募の際に推薦状が2通必要となります. 僕の場合,(1) 指導教員と,(2) D1の時にインターンでお世話になり今でも一緒に研究させていただいている方に頼みました. 2通目に関して,自分の知り合いの中でもっとも世界的に権威のある方に推薦状を書いてもらうのがいいと思います. 特に指導教員以外の人には失礼のないように早めに頼みましょう(ちなみに僕はいつもギリギリの失礼な人間です).
  • レジュメ

    • これはFellowshipの応募に関わらず,海外インターンシップなどの選考でも必要になってくると思います. まだ英語のCVを用意していない人はこの機会に作ってしまいましょう. 一度作ると,新たな業績だけ追加すればいいので,かなり楽になります.
  • ホームページ

    • Web上で書類を提出する際,自分のホームページのURLを記載する箇所があります. こちらは実際の要件には書いていないですが,最も重要な部分だと自分では思っています. 経歴(学歴,インターンシップ・職務経験),研究業績, 研究プロジェクト概要,受賞歴,レビュー経験,その他の研究活動(招待講演,ワークショップ参加,共同研究)などをシンプルに伝えてください. 僕はこの機会に以前のホームページを一新しました. CSSなどにこだわる必要はありません. むしろ変なエフェクトがあるとウザい時がたまにあります. 自分がどういう人間かを短時間で伝えるためにシンプルさに心がけてください. また,CVと一貫性を持たせれば,一方を更新してもう一方にコピペすればいいので将来楽になります.
2. 二次選考: オンサイト面接

書類審査を通過したら,中国・北京のMSRAに招待され,MSRAのリサーチャーの前で研究プレゼンテーション(全員英語)を行います. 一泊二日で中国に行くことができ,社内を案内してもらったり,ご飯をご馳走になれます. 自分は初めての中国だったので面白かったです. 昨年度は質疑応答込みの25分くらいの持ち時間で,10人以上のリサーチャーに対してプレゼンを行いました. これに関しては別の記事で詳しく書きたいと思います.

応募対象の研究分野に関して

応募対象はコンピュータサイエンスに関する様々な分野ですが,主に理論系の機械学習自然言語処理,コンピュータビジョン,インタラクション,システム系,セキュリティなどを研究している応募者が二次選考時に目立ちました. また,昨年応募する際に過去のwinnerをこちらで眺めていたのですが,音声認識やその他の音声処理に関する研究をしているwinnerは一人か二人くらいしかいなかったので,とても不安でした. 特にspeechのカンファレンスはML/NLP/CVに比べて採択率が低くありません. ですがそんな人間でもwinnerになれたので,たとえトップカンファレンスに通った成果がなくても応募してみる価値はあると思います. 俺はトップカンファレンスに通ったんだぜ!という方はぜひ業績で殴りにいきましょう. ちなみに二次選考時の面接の待ち時間にあまりに暇すぎて他の候補者のプロフィールを検索していたのですが,ML系だとNeurIPS/ICML/AAAI,NLPだとACL/EMNLP/NAACL,CVだとCVPR/ICCVの中から毎年少なくとも1本みたいなツヨツヨの人がいっぱいいました. 特に二次選考時に同じ部屋にいた人の中で,CVPRをfirstで3本持っている人が2人いたと思います. 2人ともwinnerには選ばれていませんでした. 伝え方次第で結果は変わると思います.

プロポーザルの書き方

色々書き方があると思いますが,僕が描いた一例を紹介します. 僕はLaTeXで1カラムで書きました(参考文献合わせて9ページ). スタイルファイルはIEEEのものを使いました. 提出時期が7月でTAの採点や論文執筆で忙しかったため,結局誰にも見せずに提出してしまいました. 結果オーライでしたが,少しでも確率をあげるために色々な人に見てもらいましょう(自分に言い聞かせながら).

1. タイトル

僕は「RESEARCH STATEMENT」にしました. 普通の論文と同様に名前と所属をトップに持って行くと良いと思います.

2. 段落構成

実際に使った段落構成を紹介します(あくまでも一例です).

- Research accomplishments
  - 過去のテーマタイトル1
    - 内容説明
  - 過去のテーマタイトル2
    - 内容説明
  - 過去のテーマタイトル3
    - 内容説明
  - 過去のテーマタイトル4
    - 内容説明

- Ongoing work
  - 現在のテーマタイトル
    - 内容説明

- Future work
  - これからのテーマタイトル1
    - Research question
    - Methodology
  - これからのテーマタイトル2
    - Research question
    - Methodology

- Plan and schedule

多くの人がこれまでやった研究に大きくスペースを割いてしまいがちだと思うのですが,個人的な感想としてはこれからの研究に関しても多く書いた方が良いと思っています.

3. 参考文献

自分が今考えていることが妄想ではないことを示すために,関連研究をプロポーザルの中で引用しました. 合計で51件引用しました.

4. 気をつけたこと

一つのプロジェクトに対して必ず全体像がわかるような図を添付しました. これまでの研究に対しては論文中で使った図を使えば良いと思います. また,これから行うことに関してもまだアイデアが固まっていなくても概念を表す図を必ずつけた方が良いと思います. また,(1) これまでやったこと,(2) 今やっていること,(3) これからやりたいこと,に一貫性を持たせてください. たとえこじつけでも同じ軸に沿っていることが重要だと思います, 最後の「Plan and schedule」の章では,これからやりたいことをどのようなペースでするのか年単位で記述しました.

5. その他

書類が出来上がったらWeb上で提出を行います. 締め切りギリギリまでLaTeXをいじっていたのですが,Web上で埋めるべき項目が多くてギリギリになって焦りました. その時間も考慮して余裕を持って応募しましょう(ちなみに僕はいつも締め切りギリギリのダメ人間です).

一次選考を通過したら

9月上旬あたりに一次選考の結果が伝えられ,通過したら北京でのオンサイト面接(10月上旬)に関する詳細情報が送られてきます. 一応昨年の倍率を言っておくと,一次選考通過者は25/101人でした. 学振よりちょっと高いですね! 二次選考の対策については別の記事で書こうと思います.

やっぱりめんどくさい?

最後に,応募をためらっている方へ. 自分自身もそうですが,学振などで一度プロポーザルを書いたことがあるとしても,実際にプロポーザルを英語で書くのはめんどくさいと思います. 特にD1やD2では少しでも業績を増やしたい時期なので,こんなの書いてる暇があったら論文やコードを書いたりするのに時間を使いたいと思っていると思います. 実際に自分もそうでした. ですが,応募に必要な準備はこれからもいつか必ず必要になることです. ちなみに自分は一次選考の準備に2週間かけました(学振は3日). これだけ準備がいるかどうかは人それぞれですが,僕は頑張ってやってみようと重い腰を上げました. せっかくなので,思い切ってやってみるのはいかがでしょうか?

追記

もし応募しようとしていて実際の資料が見てみたい方がいらっしゃいましたら,個人的にメールをいただければお見せすることは可能です.