kuri8iveにいきてこ。

仮面ライダーになりたい。

筑波大学(院)生活で特にお世話になったサービス・お店

こんにちは,@kuri8iveです.もうすぐ大学院を修了する見込みなので,思い出を振り返るついでにお世話になったサービス・お店をメモしておきます.これから筑波大学周辺に住む方の参考になればいいなぁという気持ちです.

続きを読む

メルカリのデータアナリストインターン参加記録

こんにちは,@kuri8iveです.
株式会社メルカリのデータアナリストインターンに参加させていただいたので,その記録を残します.参加したのは2021年8月の1ヶ月間です.

メルカリにおけるデータアナリスト

メルカリのデータアナリストがどのように仕事を進めているかはこの記事が参考になります.今回のインターンでは,@yaginuuunさんをメンターとして,Analytics Infraチームに所属しつつ主にはRecommendationチームの領分で活動していました.

参加した経緯

まず,分析職としてのキャリアを選択肢として検討していたのが第一の理由です.昨年時点ではインターン / 新卒の募集はなく今年の4月に募集が公開されたので,修士2年夏のタイミングではありますが応募し参加することにしました.(私が応募した募集は22卒対象でした.)

また,先述の記事において「本当にカオスでした」という表現がありましたが,実際どうなんだろう,どういった方向にどれくらいの改善の余地があるのだろうか,というあたりを実際に中で見てみたかったというのも理由として挙げられます.

その他,メルカリは無意識バイアスワークショップ研修資料を公開しているのですが,「こうなったらより素敵だな」という方向に社会全体が進めるように様々に取り組んでいることに個人的には感銘を受けていて,そういった組織の文化を肌で感じてみたかったというのも応募した理由の1つです.

インターンでの実際の取り組み

大きく分けて3つのフェーズがあったかなと思っています.最初の2日,次の数日,残りです.

最初の2日

入社直後は中途入社の方々も含めオリエンテーション・オンボーディングがありました.その中で文化やブランド理解のための時間が多く,驚くと同時にそういった点を重視している会社なのだなと理解を深めることになりました.メンターと一緒に参加するものもあり,新入社員がスムーズに業務に入れるような配慮を感じられたのも良かったです.

次の数日

メンターさんの業務を一部切り出してもらい,その部分をこなすお手伝いタスクを行いました.今回私が行ったのは,現在走っている施策の効果をモニターするためのダッシュボード作成です. このタスクで一部ではありますがメルカリのデータに慣れ,SQLのリハビリもできました.作成したダッシュボードはRecommendationチームのみなさんからフィードバックを頂いて改善し, 現在もチームで活用していただいているようです.同じ軽めタスクでもその成果物がインターン後も活用される方が良いなと思うので個人的には嬉しいタスク設計でした.

残り

残りの日程で今回のメインタスクに取り組みました.メインタスクは「あるコンポーネントの分析と施策提案をしてほしい」でした.背景については共有していただきましたが,どういう調査や分析を行い提案まで繋げるか,つまり全般的にどう進めるかはインターン生である私に任せられていた,という形になります.(もちろんメンターさんにはたくさん壁打ちに付き合っていただきました.)私は普段はほとんどメルカリを使ってはいなかったことから正直メルカリの理解が深いとは言えなかったので大丈夫かなーという不安はありつつのスタートでした.

実際に行ったことも大まかには3つに分けられるかなと思います.方向性の確認,現状把握,分析実行と提案整理の3つです.

方向性の確認

ここで方向性というのは,会社がメルカリというサービスをこれからどうしていこうとしているのか,です.どういう未来図を描いていて,その未来へどういう戦略で到達しようとしているのかを知ることで,戦術に相当するところの分析が戦略とチグハグになるのを防げると考えておりそうするに至りました.具体的には,決算資料であったり社内のこれからのロードマップなどを確認していました.

現状把握

先に述べた通り私自身はメルカリを日常的には使っていなかったので,その分多面的にプロダクトを観察することでより正確な現状把握を試みました. 具体的には,

  • 自分のメルカリアプリをいろいろと触ってみて,当該コンポーネントの様子を見た.
    興味あるキーワードで検索したりいいねしたり,ちょうど不要品があったので出品してみたりもしました.
  • 利用している知り合いに聞いてみた.
    幸いにもメルカリを普段使いしている知り合いが数名いたので,軽くヒアリングして実際のユーザーがどう感じているかの理解に努めました.
  • 当該コンポーネント関連の過去分析事例を調べた.
    これまでにどのような分析が行われ,どういった知見が得られ,現在に至っているのかを調査しました.この調査によりただ現状のプロダクトを眺めているだけでは得られない知見を獲得することができたと思います.
  • 当該箇所の実装コードを読んでみた.
    データアナリストのインターンでももちろん会社のリポジトリを閲覧する権限は頂けるので,当該箇所がどのように実装されているのかコードを読んでいました.コードを読んだことで自身がアプリを触ってみた時の変化の仕組みが理解できたほか,施策提案の際に実装をどう変更するか,そのコストはどの程度になりそうか,まで把握することができました.
  • 生のログデータを見てみた.
    クエリを叩いて実際のユーザーがどのように行動していたのかを見てみました.平均等の集約処理をした結果だけでなく,あるユーザーの行動に着目したログも見ていたので,メルカリがどう使われているかについてより理解を深められたかなと思います.
  • アンケートから課題を洗い出してみた.
    過去に行われたアンケートから,現在のメルカリの課題点はどこにあるのか検討しました.他の方法では得られない"メルカリのイメージ"を掴むのに大変役立ちました.
分析の実施と施策提案

具体的には,まず先述の現状把握で得た知見を整理し,次に関連しそうな論文を探して読むことなども行って,分析する前にいくつか仮説を立て,それに基づき分析案やラフな提案をまとめました.そして,この段階でRecommendationチームのエンジニアの方々からフィードバックをもらっています.それを踏まえた上で,今回の分析と施策提案の着地点を練り直し,分析計画をブラッシュアップした上で分析を5つほど実施しました.

それから分析結果を踏まえて提案施策を検討しまとめましたが,この際に単に"こうしましょう"と提示するだけでなく,具体的に現行アルゴリズムのどの部分をどう変えるか,その変更が入った場合にどのような変化がユーザー側に現れるかの例示,実際に実装されABテストを走らせる場合にどの指標を見るべきかどの指標は気にしないで良いかといった点を整理し共有しました.実際に期間中にABテストを走らせてはいないのですが,自身の取り組みがインターン後に実際に何らかの形で活用されプロダクトの改善に活かしてもらうため,より建設的な議論ができるように必要な工程に取り組んだつもりです.

全体を通しての感想

"実際に自分が入社したらどんな仕事をするのかな"といった点を非常に良く感じられるインターンとなり,充実していたなーというのがまず感じたことでした.メインタスクが実際の業務そのものであったことももちろんですが,Analytics / Recommendationの定例の2つともに参加できたので,実際に入社したとしたら一緒に働くであろう人たちがどんなことにどう取り組んでいるのか理解できたのも良かったです.

また,メンターさんマネージャーさんと適度にコミュニケーションが取れ円滑に進められたのも充実感に繋がったと思います.インターン中に何度か病院に行ったのですが,体調最優先でというのを開始前から伝えられていたのでその辺りも不安なくインターン業務を進めることができました.

あと,定期的にインターン交流ランチ / ディナー(オンライン)があったのも個人的には良かったです.やっぱりこのご時世なかなか物理的には会いにくい中で,同時期にインターンに来ている方々と交流する機会を積極的に設けていただいたのはありがたい気持ちがありました.

それから,参加した経緯に記した「カオスさは実際どんなものなのか」「どういった方向にどれくらいの改善の余地があるのだろうか」という点についても,インターンで関わった範囲で肌感を得られたかなと感じています.カオスさについては,これまでにもたくさん良い取り組みは行われているものの,システマチックにそれらを行うための仕組みづくり(メンターさんが以前発表されたExperiment Design Docはその素敵な取り組みの1つだと思っています)が発展途上なのかなと感じました.また,現状でも十分素晴らしいプロダクト・サービスだとは思いますが,人々の生活を豊かにしてくれる社会インフラとなるにはまだまだ伸び代はあって,その実現に取り組むことはきっとやりがいのあるチャレンジになるだろうなという気持ちを抱きました.

終わりに

とても実りあるインターンでした.メンターさんを壁打ち相手 / ガイドさんとして活用し主体的にあれこれ進められる方なら,きっと楽しくまた実りあるひとときにできるインターンかなと思いました.
本記事で興味を持たれた方がいらっしゃいましたら,今後募集があった際には是非応募してみると良いと思います.

2020年振り返り

f:id:kuri8ive:20201231175329j:plain
年始に撮った写真

こんにちは,@kuri8iveです.
今年はネタがあまりないのですが整理のため書きます.

研究

端的に言って上手く進められませんでした.
今年の辛さの大部分はここに集約されるなと感じています.
指導教員には非常に熱心に手助けしてもらっているにも関わらず,
自身の諸々の資質不足で投稿にすら持ち込めず申し訳なさの気持ちが強くあります.
もっと日常的に力をつけていかないと先はないなと思いました.

インターン

Gunosyと日本マイクロソフトの2社にお邪魔しました.

Gunosy
以前参加記録を投稿しましたがGunosyではリサーチインターンを経験しました.

kuri8ive.hatenablog.com

人工知能学会での発表では,リモートの影響からか全体としては質問があまり出ない中,
何人かの方から質問を頂けたのもありまずまず良かったです.

日本マイクロソフト
夏休みには日本マイクロソフトにお邪魔し,
CSA (Cloud Solution Architect) のインターンを経験しました.(NDAの都合参加記録はなし)

careers.microsoft.com

これまではいわゆるWeb系,C向けビジネスの企業にお邪魔することが多かったので,
B向けビジネスの現場でその実際を垣間見ることができ,こちらも良い経験となりました.
また,このインターンでは参加者同士の交流の場が設けられ
オンラインで活発なやりとりがあったので,
昨今の情勢を考えると気持ち的に非常に救われました.

進路

M1の冬になりましたがまだ決めていないです.
元々の性格によるところも大いにあると思いますが,
やりたい/興味あることが絞り切れていないのが1つ大きいかなと感じています.
進学に関しては主に博士後期課程経験者の方々に相談に乗っていただくことができ,
考慮すべきポイントはある程度は把握できていると感じているので,
あとは自分の性格や志向を踏まえてやりたい/興味あることに優先順位をつけ,
最後はえいやで決めるしかないなと思っているところです.
なるべく早めにクリアにしたい気持ちはあります.

今はこの本を参考にしつつ色々書き出しています.

その他

行動記録
昨年秋からカレンダーにほぼ毎日行動記録をつけ始めたのですが,
珍しく1年以上続き習慣化することができました.
研究,授業など大まかなくくりではありますが,可視化するだけでも分かることがあり
良い習慣が身につけられたかなと思っています.
誰かが既にやっていそうですが,
Google Apps Script等で集約して可視化するとさらに良さそうな気がしています.

読書
本を全然読んでないなと思ったので,
多くはないですが読書の時間を確保するようにしました.
今はやはり研究や進路に関連するものが中心ではありますが,
それ以外のいろんな本も読んでいきたいなというところです.

今後

2021年はこの辺を頑張っていきたいです.

  • 修論,またその内容での論文投稿
  • 取扱説明書が作れるくらい自身の理解を深める
  • 知識,思っていることなどをなるべく頭で保持せず文書等に移転する
  • 重要ではあるが急ぎではないことに取り組む時間を日常的に確保する
  • 上手くいかなくてもポジティブな点を見出して不必要に自尊心を削らない
  • 進路をどうするにせよ,TOEFL iBT 100
  • 下の兄弟の進路に何か良いヒントをもたらす

昨年もですが,今年もまた様々な方に色々な面で助けていただき,
本当にお世話になりました.
来年はもう少し私が周りを助けられるように精進したいです.

Gunosyリサーチインターン参加記録

るいすです.株式会社Gunosyのリサーチインターンに参加したので記録を残します.
期間は2019年12月26日〜2020年3月31日のうちの1ヶ月間です.

Gunosyと研究

Gunosyは近年多くの研究成果を上げています.昨年だけでもKDD'19, WI'19, RecSys'19にFull / Short paperが採択されており,今CSの研究で存在感のある日本企業の1つであると言えます.元々学会のスポンサーや国内学会の研究発表などは行われていましたが,研究専任チームが誕生したことによって加速度的に研究成果が増えてきています.その他,毎週論文読み会を開いておりその資料は随時GunosyDMで公開されています.

data.gunosy.io

data.gunosy.io

data.gunosy.io

参加した経緯

論文化を前提に企業で研究を行ってみたいと考えたのが大きな理由です.特に,現時点での私の研究のモチベーションは応用寄りであるため,自社サービスにユーザーを抱えている企業で研究を行えればと思っていました.加えて,まだ研究能力が貧弱であるためメンターをつけてもらえて,既に研究のサイクルが回っている企業であることも望んでいました.

また,卒業研究では主体的に取り組んだとは言えテーマ自体は指導教員から降ってきたものであったため,テーマ決めの部分からチャレンジをしてみたかったというのも理由の1つです.もしそれでさっぱり何もできずに終わったら,それはそれで自分が研究に不向きと分かっていいだろうしと考えていました.

さらに,KDD'19の筆頭著者がインターン生であることも後押しになりました.KDDデータマイニング系のトップカンファレンスで,採択率が2割を切ることもあり非常に論文採択の壁が高いため,このニュースにはとても驚きました.筆頭著者のしゅんけーさんの研究力が原動力であるのは確かだとしても,それをKDDレベルまで引き上げられる環境もすごいと感じ,非常に魅力的に映りました.

そしてちょうどGunosyがリサーチインターンの募集を始めたため,乙女座の私はセンチメンタリズムな運命を感じ,応募しました.書類審査を通過したのち,プロポーザル審査を受けました.これはGunosy側から提供された取り組みたいテーマリスト or 自分がやりたいテーマについて,こういった背景からこういう研究をしたいという研究プロポーザルを書いて提出するというものです.1ヶ月程度の間に論文を読むなどして情報を集め,最終的にIPSJ全国大会のフォーマットで参考文献込み3ページにまとめ提出しました.(IPSJのものを使った理由は特にないです.)

プロポーザル審査を通過すると面接があります.ここでは主にプロポーザルに記載した研究計画に関しての質疑などが行われます.といっても,プロポーザルの計画そのものの完成度・緻密さが求められているわけではなく,研究に対するモチベーションや研究を立案・実行する基礎体力が備わっているかを見ているようです.実際,私のインターン成果であるJSAI論文は研究プロポーザルとは全然別物になっています.この面接を通過すると晴れて研究インターン参加となります.

研究の進め方

基本的には自分でデータを集めコードを書き実験を行います.と同時に適宜メンターさん(私の場合は関さん)にメンタリングをしていただきます.その他,Slackに自分のチャンネルができるので,そこに困ったことなど書いて社員さんに助けていただくことも多々ありました.

やったこと

チュートリアル

SQL課題をやります.元々データ分析のインターン生向けのもののようですが,研究でもデータを引っ張ってくる時に必要であることから用意されてるのだと思います.SQLの使用経験が浅くSQL力が貧弱な私はこれに1日以上費やしてしまいました.

ボツ研究テーマ

プロポーザルをもとに,チュートリアル終了直後から半日程度とりあえず色々案出しをしていました.この段階で一度関さんと打ち合わせをして方向性などについて検討をしました.そして,〜の背景から〜というリサーチクエスチョンが考えられるので〜を確認して検証する,といった研究草案をここで一気に固めました.スタンスを取るとアドバイスする側もアドバイスしやすくなると考えていたため,早期に一旦まとめた選択は良かったと思います.そこからアドバイスをいただいたり関連しそうな論文を読んだりして計測すべき指標リストを決めました.結果的にこのテーマを論文にはしませんでしたが,スピード感を持って進めたことでアドバイスを多く引き出すことができテーマの深掘りができました.

ここからデータ収集・指標の計測に入りましたが,前者で大苦戦してしまいました.ほしいデータがどこにあるのかといった情報だけでなく,計測結果が奇妙な時の要因がなかなか分からず,もちろん質問して解決していたとはいえ随分時間を費やしてしまいました.加えて私がSQLについて何も分かっておらず,大きいデータを引っ張ってくるのに実行時間が遅くなる書き方をしていたこともあり,自身の力不足を痛感しました.

ここで,計測結果そのものは良さそうだが論文としての落とし所がいまいちだと感じたため,関さんに相談をお願いしました.そこで「元々どういうモチベーションなんだっけ」というところに立ち戻って検討を行い,その結果テーマを変えることにしました.

JSAI論文テーマ

「ニュース閲覧行動を用いた選挙の争点分析」というテーマに後半は取り組みました.先のボツテーマや相談を踏まえて今一度目的や方法などを整理してから始動し,以降は上記と同じくデータ収集・指標の計測に取り掛かりました.

今回は社内Wikiに早めに現状まとめを作成したことやJSAI論文執筆と並行しながらの作業だったことから,論文としての物語を常に意識しながら作業できたのが良かったと思います.また,ある程度良さそうな結果が出たところで関さんにメンタリングしていただき,「主張したい内容を適切に示すにはどういう実験結果が必要だろうか?」という観点から実験について練り直せたのでボツ案の時の失敗を上手く活かせたかなと思いました.

また,手法の提案はなく分析だけの研究にはなりましたが,その分普段読むことのない政治学の論文を読み,分析結果からの示唆を充実させられるように努力しました.(論文に入れるのが間に合わなかった話が多いのは反省です.)

最終的に,このテーマで人工知能学会全国大会に論文を投稿するところまで持っていくことができました.提出直前も関さんにめちゃくちゃ助けていただき,良い感じに肉付けできるよう導いてもらいながらなんとか間に合わせられました.もし私が書いた素の状態であればなかなか見苦しいものになっていただろうと思われます.

f:id:kuri8ive:20200331231057j:plain
鯖落ちにより提出失敗かと思われたがセーフ

終わりに

充実したインターンでした.しゅんけーさんもしばしば言及されているように関さんのメンタリングが素晴らしく,議論しながらアイデアを膨らませたり落としどころを探したりするのが楽しかったです.研究チームは小さいもののその分距離感も近く,またデータ分析のエンジニアは多数在籍しているためサポートは十分あります.もちろん自走力は必要ですが面接を突破できる程度あればやっていけるはずです.求人にも記載があるように研究を行う人のモチベーションがとても重要視されているので,そこまで詳細な研究案を思いつけずともモチベーションがあってGunosyのデータや研究に興味がある方は是非飛び込んでみると良いと思います.

hrmos.co

私は一旦終了することにしましたが,目安として1ヶ月の間に国内外査読有無を問わず論文にまとめられればその後も続行できるので,研究成果を継続的に出していきたい方にもぴったりです.