Category: Uncategorized

2018 年度 Excel Pre-勉強会

pre-勉強会の様子 去年の夏休みに筑波大学蹴球部データ班だけでExcelの勉強を全部で6回行いました.トピックが多く,内容も詰まっていて普段あんまりパソコンを使わない人にとってはかなりハードな勉強会だったかもしませんが,去年は割とうまくいった気がしています. 今年は新しく入ってきた1年生などに向けて同じような内容を取り扱って2018年度勉強会を開催することにしました.去年の講師役は私が担当しましたが,今年は現在情報科学類2年生の長谷川諒に担当してもらうことになっています. 2018年度の日程はまだ決まっていないですが,蹴球部以外の方も歓迎で参加はだれでもOKです! 去年の内容と予定(今年は未定) 2017/07/18Topic 1 導入Topic 2 基本と整理 2017/08/07Topic 3 数式と関数Topic 4 記述統計 2017/08/09Topic 5 相関と回帰 2017/08/30Topic 6 KING KONGの仕組み(フィジカルテストのフィードバック用紙) 2017/09/29Topic 7 Stats Creatorの仕組み(スタッツ取得ツール) Pre 勉強会 本来2018/09/11にデータ班や外部の参加希望者と勉強会を行う予定だったが,日程調整が会わなかったり,広報が上手くできていなくて,参加者がデータ班7名だけになってしまいました... だから今回はpre勉強会にしといて,去年勉強会に来れてない人を中心にTopic 1とTopic 2を試し教えて,本番はまた今度ということになりました! 以下,Pre勉強会の内容になったTopic 1とTopic 2について! TOPIC1. Excelの導入 大学サッカー界のデータ解析を牽引するためのスキルを身につける データ班の勉強会の目的は『大学サッカー界のデータ解析を牽引するためのスキルを身につける』ということで,サッカーに出てくるデータをたくさん使って勉強会を進めるようにしています. 蹴球部ではデータの取得~解析まで全部部員たちで行っています.そのため,入力プロセスを楽にするショートカットからExcelのデータ分析ツールの使い方,マクロの作成方法まで幅広くカバーしています. 解析結果を上手く伝えることもデータ解析のプロセスに入ってくるので,スライドをできるだけ綺麗に作成しています. TOPIC2. Excelの基本と整理 アジェンダ 基本操作ショートカットキーデータの整理・追加・結合・分類・並び替え異常値の発見不整合の発見 基本操作・ショートカットキー TOPIC2から具体的な内容に入り,エクセルのファイルを開く・保存するといった超基本の操作を確かめてからそれらをショートカットでどう行うかを説明するところから始めました. どの学部でもレポートでエクセルを使っているので,全員基本操作は知っていたがショートカットが初耳の人がほとんどです. データの整理・追加etc. データを触る上で必要な操作もフィジカルテストで取得したデータを扱って実際に行いながら勉強していきます. 異常値の発見 さっきも述べた通り,部員がデータの取得・解析・伝達をしているため,解析を始める前に扱っているデータに間違えないかを確認する必要があるかないかを見極める必要があります. 入力ミス一つで平均が多く変わってしまうからこそ,データを入力したあとにグラフを作ったり,並び替えたりして異常値がないか確かめることは大切です. 課題  勉強会が終わったら,最後に宿題として以下のような課題をやってきてもらうようにしました. […]

Read More

サッカーのハイライトビデオの作り方

Movie MakerからPremiere Proへ  データスタジアムのアナリスト育成講座や茨城県国体のビデオ編集スタッフを通してサッカーの映像を編集する技術が必須であった. 最近まではPCにデフォルトで導入されていたMovie Makerを使って動画を編集していたため,動画を切って貼り合わせるだけの作業は効率的に行えていたが,それ以上のことはあまりできなかった. Movie Maker と Premiere Pro の比較 そこで機能がもう少しある動画編集ソフトのお試し版を使ってみたが,購入しないとウォーターマークが入ったりしたので本格的に勉強する気が起きなかった. 最近,後輩と割り勘すれば月額1000円でPremiere Proが含まれたAdobe Creative Cloud が使えるということが分かったので,ダウンロードした.これがかなりいい判断.けっこう使いやすいし,色々機能がありそうだった. Premiere Pro で動画を作る過程 いきなり細かいところまで書くのは面倒で,たぶん多くの人がこの投稿を見ることはないので,自分のメモ程度に書いていく. ハイライトビデオ・タクティカルビデオ作成 動画をインポートする・見る・切る 動画をインポートする・見る・切る 番号については下記参照 ①メディアブラウザー:ここから動画を選択してインポートする ②タイムライン:動画や音声などからシークエンスを作成する ③ソースモニター:シーケンス内の動画を編集する ④エディティングワークスペース:シーケンスを超えての編集 他にも多くのパネルがあり,Windowなどから選択し,表示できる. 動画を見る サッカーのハイライトを作るので,まずは動画をじっくり見る.すでに一度見たことのある試合であるならば,再生速度を速めて(J)見よう.また,気になるところがあればマーカー(M)をつけてメモを取っておこう. 他にも使えるショートカット マーカーを使うことで動画を全部見てから,切り取り作業に入れるので効率が良い.また色分けやコメントも残せるので,色でソートさせたりしたり,コメントを見返して重要だと思った理由を振り返ることができる. マーカーは便利だ 必要な部分以外は切り捨てる 試合を全部見て,マーカーを付け終わる以下のようになるはずだ. 映像を見るときにはソースモニターをドッキングから解除すると大きな画面で見ることができるため見やすい.この試合でのマーカーの色は次のように設定した: ピンク → 試合開始やハーフタイムなどのタイミング 青 → 相手が良いプレーをしたシーン 水色 → 相手がゴールしたシーン 赤 → 自チームが良いプレーをしたシーン オレンジ → 自チームがゴールしたシーン 今回,作成しているのはハイライトビデオなので別け方はこれで十分なはず.ここにタクティカルな分析が加わると,もう少し細かく見たいのでより多くのマーカーを使うだろう.また,タイムラインの最後にたくさんのマーカーがあるのはPK戦が最後にあってそれぞれのキッカーにマーカーをつけたからである. […]

Read More

トラッキングデータを扱う最適なニューラルネットワークを実験的に探索するwith pytorch

With Pytorch! Pytorch.com上にRNNを用いた名前の出身国を識別するチュートリアルがある. このチュートリアルでは単語(名前)を一文字ずつ読み込み、各タイムステップで隠れ状態を出力して、次のステップにその隠れ状態と次の文字を入力として読み込むRNNを作成する. チュートリアルで作成するRNN RNN Model import torch.nn as nn class RNN(nn.Module): def __init__(self, input_size, hidden_size, output_size): super(RNN, self).__init__() self.hidden_size = hidden_size self.i2h = nn.Linear(input_size + hidden_size, hidden_size) self.i2o = nn.Linear(input_size + hidden_size, output_size) self.softmax = nn.LogSoftmax(dim=1) def forward(self, input, hidden): combined = torch.cat((input, hidden), 1) hidden = self.i2h(combined) output = self.i2o(combined) output = […]

Read More

大手データ分析会社が考えるデータドリブンとは

ビッグデータ,人工知能,データドリブンと色々な言葉が飛び交う中で,大手はデータドリブンに対してどのような考えを持っているのか. IBMやSAPといった大手がデータドリブンな組織について論じた文献を調査して,一つの記事にまとめた. この記事は以下をもとに作られています. What does it really mean to be a data-driven business?Become Data-Driven or Perish: Why your company needs a Data Strategy and not just more Data PeopleThe evolution of the data-driven companyThree keys to building a data-driven strategy データドリブンの定義 ビッグデータ・人工知能と同様にデータドリブンという言葉はバズワードであるという認識を持っている人多い気がするが,そうでもないと思う. データドリブンな組織とは?どの階層でもデータを戦略的資源として扱う組織CHRIS PENN氏 / IBM SAPのPhil Simon氏はさらにデータドリブンな組織の細かい特徴を以下としている: 人の意思決定をデータ分析で補完・修正することを受け入れている. 組織内外でデータを用いた実験やテストを行っている.アマゾンは頻繁にA/Bテストを行うし,ネットフリックスはkaggleで有名なデータ解析コンテストを開催した.データ取得のために大きな金を払える. マイクロソフトは$26Bでリンクトインを買収.多くのアナリストはこの動きをデータ取得のための戦略的な買収だとみた.異なるソースから取得したデータを統合できる.フェイスブックはインスタグラムのデータを活用している.報酬が確かでなくとも新たなデータを分析できる. ネットフリックスはイメージ画像の配色を分析して,収益を伸ばした.データの可視化に力を入れている. 非構造化データから勝ちを見出せる.  データドリブンな組織に必要なものとは データ データはこれまでプロセスの副産物として見られていた. 例えば,商品の売買に関するデータは返品や売り上げの報告など特別なシチュエーションにしか活用されなかった. 今ではこれらのデータを分析することでより良い意識決定が可能になると認識されるようになってきている. […]

Read More

データスタジアムアナリスト育成講座でスキルは身につくのか

(この記事はまだ編集中です.内容が増えたり,減ったりします) 現象でなく,要因 Vol.1では毎週Jクラブのアナリストになりきり,次節の対戦相手を分析するということを繰り返し行っていた. 第一回目の様子.自分〇.こちらの記事から→link 講座期間中の2か月は,昼間に授業を受け,夜に練習して,その後に提供された3試合を見て分析して,フットボールラボのデータと切り出した映像から7分間のプレゼンを作る日々.天皇杯前に3つ上の先輩がベガルタの分析をしている傍ら,講座の課題こなす朝の4時半を思い出す. とにかく映像から相手の特徴を読み取るアナリストの基本的なスキルが磨かれた. 『現象ではなく,要因』データスタジアム 久永さん 特徴が出ているように見えるプレーに対して,なんでそれが起こったか. プロレベルにおいて,一見間違った判断,ポジショニングでも,その裏側には訳があり,その訳を知らないといけないということがvol.1から持ち帰った知識だった. ただ『相手はこうだ』といってもそれはテレビの解説者と言ってることとなにも変わらない.それだと下手な分析映像を作るよりも,ハイライト動画を見せたほうが良い.戦術的なアドバンテージを持つためには相手がなぜそのようにプレーしているのか,要因が分からないと汎用的な分析にならない. 育成講座の資料をもとに作成 第1回目の時のプレゼン資料 ↑僕はこんな感じでパワポのスライド+編集した映像で7分間のプレゼンを作った. 映像はデータスタジアム社から提供されているのでアップしたら怒られると思うのでアップしません. Net Striker が使えた Vol.3 Vol.3はコンテンツがパワーアップしていてデータ分析までカバーするということでどうしても参加したくなった. データスタジアム社ホームページよりデータスタジアム社ホームページより Net StrikerJリーグの試合のプレーデータ(1試合約2,000項目)を詳細に分析できるサッカー専用のWEBシステムです。それぞれのデータは映像(該当シーン)とリンクし、すぐに映像の確認・編集ができるので、Jリーグクラブの分析担当の方や強化部などでご利用いただいています。対象はJ1・J2・J3・JリーグYBCルヴァンカップの全試合です。また、WEBサービスなのでソフトウェアのインストールは必要なく、インターネット回線があればいつでもどこでも利用できます。https://www.datastadium.co.jp/service/net-striker.html 第1回目の講座では使えなかったデータスタジアム社独自のNet Strikerというツールを使えたことで,複数試合から動画を切り出す作業が効率化されて分析映像の質にこだわることができた. 前回の講座では特徴となるベストなシーンを探しだしのに一番苦労したが,Net Striker を使用したことで伝え方や細かいデータまでに時間をかけられるようになった. 最終課題はW杯の試合分析 ちょうど時期がW杯とかぶって,W杯出場の映像分析をすることが最終課題になった.ちなみに僕はフランス代表の分析を担当した. まず,問題になったのは映像の調達.W杯の映像はデータスタジアムから提供されないため,自分たちでダウンロードするしかなかった. 自分はredditからダウンロードリンクを見つけたが,NHKから直接ダウンロードする強者もいた.(プレゼン後にやり方を教えてもらって全試合・全アングルでダウンロードできた.いずれ研究に使えればと思っている.) 作成したプレゼンを動画にしたが,初めてadobe premier pro を使ったので最後の再生速度がなぜか倍になってる笑. 時間あるときに再生速度を直して,戦術カメラ・ワイヤーカメラの映像を活用して動画を作り直したい. まとめ パワーアップしたコンテンツに加えて,データスタジアム社自体の進化が伝わりぞくぞくした.成長する企業の展望を耳にして,焦りを感じると同時にもっと頑張ろうと勇気づけられた. アナリスト育成講座は刺激がたくさん.他の受講生たちも半端ないのでお勧めです.

Read More

サッカーで筑波大学情報科学類にAC入試で合格するには

筑波大学のAC入試に挑戦したい後輩から連絡があったことをきっかけに自分の経験まとめてみようと思う. AC入試とは? 志願者の主体的で継続的な取り組み・問題解決能力に着眼点を置いた従来のテスト型入試と異なるタイプの入試.→ほぼAO入試. https://www.slideshare.net/SusumuKataoka/20180312acao 第1次選考(書類審査)・自己推薦書と志望理由書が必要↓第2次選考(面接・口述試験)・3対1で志望理由などに関して質問を受ける それ以外の情報は筑波大学のホームページから十分に得られるはずだろう. AC入試・特別入試ガイドブック入学者の「合格まで」と「入学まで」※↑自分は書いていない. 志望動機 なぜ筑波大学か 高校生の時に熱中していたものといえば,サッカーと音楽ぐらいでそれ以外は中途半端だった.そんな感じだから将来何がしたいかという具体的なイメージはなかった. だけど国際バカロレア課程の最終プレジェクトのPersonal Projectでサッカーのトレーニングについてまとめた本を書き,評価が悪かったことをきっかけにより科学的にスポーツを見るようになったことは人生の中でも転換期だったと感じる. 実践編表紙理論編表紙栄養についてメンタルについて目次当時読み返すのが恥ずかしくて誤字脱字が多いままです笑 高校2年生のときにはまた新しい自主研究をするチャンスを得て,そのときに初めてサッカーを科学的に見た.端的にいえば,筑波大学の浅井先生の研究を真似して,サッカーキックの動作時に各関節の速度を計測した.ただ計測には特別なプログラムを使用せず,計測用のプログラムまで書いたのがポイントである.→ここで書いたプログラムをブラッシュアップしてAC入試に提出した. こういう経験を経て,自分は大学でスポーツを科学的にみたいと思っていた.そのことを学芸大学の体育の新海先生に相談したところ,「国立なら筑波大学しかないよ」と言われ筑波大学を目指すことになった. なぜ情報科学類か 高校2年生のとき(新海先生に相談する前)体育専門学群のオープンキャンパスに行ったが,プロや教師を目指す学生が多いと言っててちょっと違う気がした. 高校3年生のとき関節速度計測用に初めてプログラムを書き始めて,コンピュータが好きになった新海先生が情報科学類でもいいんじゃない?っていってくれた筑波大学の山際先生に相談したときの対応が素晴らしかった(笑 ということがあり,若干情報科学類よりになっていた.それでもすごく迷って最終的には情報科学類のほうが挑戦的に見えたからそっちにした気がする. 第1次選考(書類審査) 志望理由書 いままでずっとサッカーをプレーしてきた自分がなぜ情報科学類に入りたいのかを正直に書いたと思います.読み返すと偉人みたいな口調で笑えるけど,いまでも書きそうな文面になっているし,全然軸がぶれてない. 志望理由書の本文は下のギャラリーに入れといています. 自己推薦書 以下の書類をまとめて提出した.プログラムのソースコードに自信なかったし,変になぜC#で書いたんですか?とか聞かれたら困るので提出していない.その代わりに,書いたプログラムの解説動画を作って提出した.コードをよくみればバグってところも多分ある. フットボーラーズマニュアル  .PDF(CD1) 画像測定と表計算お用いた運動解析ツールの開発  PART1 画像測定と表計算お用いた運動解析ツールの開発 PART2 発表会に用いたプレゼンテーション資料 各賞状や受賞を証明するもの BWFCの解説動画 (CD2) ....スマート革命ってなんだろうね 笑 第2次選考(面接・口述試験) 1年しかプログラムを書いてない自分が1次試験通過できるのかが心配だったが,そこだけクリアすれば合格できると考えていた. 面接に関する対策はばっちりで合格者のブログを探してオススメの本だったり,自分で予想問題集を作ったりした. あとは高校の先生に模擬面接をやってもらったので完璧だった. 質問内容はあまり覚えていないが,最後の質問は Them「筑波大にはいってやりたいことがいっぱいあるようですが,大学で全部やるにはなにが一番大事だと思いますか?」Me「..Vision.」 って言ってかっこつけた覚えがある 笑 予想問題集(聞かれたのは*) ジェネラル *今回提出した自己推薦書の内容を5分で説明してください*なぜ情報科学類を志望したのか*将来の進路もし、20年前のインターネットが無い時代に大学に入学するとしたら、どこへ進学したいか*筑波大についてどう思うかどんな高校生活だったか高校生活で頑張ったこと長所と短所短所で失敗した経験最近感動したこと最近読んだ本とその感想オープンキャンパスに来たことがあるか部活動以外で学校生活で心に残っていること 学校の勉強に関して *英語は得意ですか学校の成績勉強をする際に工夫したこと*得意、不得意科目*数学は得意か(実際には好きか) プログラミングに関して プログラミングではどのような言語を用いていたのか プログラミングはできるか 部活に関して 部活動の具体的内容 […]

Read More

Data-backed → Data-assisted ← Data-driven

(考え不足のところがあって主張に穴があると思いますが,埋めていきたいと思います!) 主観が重視される分野でどのようにデータは活用できるのか 最近自分の中でテーマとなっているのは,データ解析の意義である. 世の中を見渡せば,データは大量に作られており,そのデータに基づいた解決されうる課題は多くある.特に,最適化は実際あらゆる場所で使用されており,それを基礎とするAIと呼ばれてしまう機械学習の手法は未来だと考えていた. データで客観的な議論が可能であり,サッカー界・スポーツ界でデータドリブンなカルチャーを作るために大学サッカー界の分析から牽引していくという目標間違っているのか.サッカーのデータを見るようになって2年.少し疑問を抱くようになった. 最初は違和感だった. 遠くを見れば,フェイスブックやグーグルといった企業はAIに力を入れ,世界をリードしている.IBMはデータを現代の通貨と呼んでいた.しかし,私の周りの成功者は一貫して “Data is not answer”という態度を取っている.だがそれは決してデータに基づいた分析をないがしろにしている訳ではなかった.むしろ逆で,全員データを重宝していた. データを重要視しているのの,あえてデータドリブンにならないところに違和感を覚えた. データで自分の意見を強くする Data-Backed思考 世の中の多くの分野では,現象を数値化して分析しても限界がある. それはデータの量が足りない,適切でないデータしか取れないetc. 様々な理由があるかもしないが,どのみち分析屋さんにデータを投げて改善しないことがたくさんある. 主観的分野のエキスパートたちは経験や感性で意識決定をして成功を収めているからいままでデータからなにかを読み取る必要もなく,データはただただ自分の意見の根拠となりうるものでしかなかった. *裏付けるデータのところは全部空想です. データは嘘をつく Data-Backed思考の人はセレクティブにデータを選んで分析方法を変えることで,どんなデータでも自分の意見を裏付けるための根拠となりえることを知っている. そのため,彼らは他の人がデータで自分の主張を裏付けても(要するに他のData-Backed思考の人と会っても)データをあまり見ないだろう. → 折れ線グラフの伸び率を大きく見せるトリックとは?(第5回) データを頼りに自分の意見を作るData-Driven思考 Data-Assisted思考ができないといけない 他の考え方 https://www.infoworld.com/article/3074322/big-data/what-is-a-data-driven-company.html The evolution of the data-driven company

Read More