アンガーマネージメント

このブログには基本データ解析に関する話を書こうと思っていたのですが、自分の備忘録的に久しぶりに投稿します。

今日は久しぶりにfuriousな事案が発生しました。furiousは日本語だと怒り狂うみたいな感じですが、なんというか、怒った(angry)のレベルではない、furiousという感じ。

私も最初は今ひとつピンと来ませんでしたが、アメリカで仕事を数ヶ月していたときに友達が、今、僕はfuriousなんだよ、分かる?angryじゃなくてfuriousなんだよ、と彼の仕事に対して文句を言っていた時、ああ、このぐらい怒ってるときにfuriousを使うんだなーと思ったのを覚えています。そう、あのレベル。

怒った理由を書くのも大人げないのと、平常心に戻って考えれば、それほど怒らなくても良かった案件だなとも思ったりするので、詳細はスルーしますが、久しぶりにこのレベルの怒りが発生して、平常心に戻るまでにいくつかのステップがあったので、ここに書いておこうと思います。

外国だと、Anger Management はマネージメントのレベルになった人が受けさせられるようなクラスだったりするのですが、日本ではあまり聞きません。外国では部下を怒鳴る、という事はあまりなく、そういう人は、Anger Managementが出来てない、Education level の低い人という烙印を押されるような場合もあるので、頭ごなしに怒鳴ったりというのは、ほとんど見かけません。まぁ居るとは思いますが、どちらかというと良い評価にはなりません。なので、みんなAnger Managementが出来ている感じです。 私はAnger Managementのクラスを受けた事がないので、自分なりにどうやって今日の怒りをコントロールしたか、書いてみました。

1.まず、何に対して怒ったのか、自分を分析

これ、何かの本に書いてあったと思うのですが、自分の感情を分析する立場に立つ事で、客観的に物事を見る事が出来、冷静になれると。確かに少し落ち着くために自分の感情を分析してみました。なんでも分析大好きなので、自分が怒っている理由を考えると、それは自分が思ったようになってないから。そしてそれは、自分の中では、約束したら守るもの、という定理のようなものが守られなかったから、怒っているのだなと。

2.場所を変える

私は在宅勤務のため、あまり話す相手もおらず、これは良くないと、とりあえず晩御飯の買い物も兼ねてスーパーへ買い物へ行きました。少し外に出ると気分も落ち着きました。

3.ぜんぜん関係ない人と、くだらない話をする

この事案に全く絡んでいない人と、Lineでくだらないスタンプを送りあったりして、今度会う予定を決めていたりしたら、面白いスタンプを見てつい笑ってしまい、笑えた事が嬉しくなりました。

4.別の事で頭を集中させる

これ、よく言われることですが、実際に実行するのは難しいと思っていました。今回はスーパーで「あれ、切れてた調味料なんだっけ?なんで切れてる事に気づいたんだっけ???」と昨日や数日前のおかずを思い出していたら、自然と頭はその事だけ考えるようになり、「あー、お酢がないんだ!」と思い出すと、それはそれで嬉しくなりました。これはいいなという事で、他にも何かあったよな、と家中の洗剤やら、お風呂場で使うものを順番に思い出しながら、買ったほうが良かったもの、ストックが切れてるものを考えると、自然と怒った内容は考えなくてすむようになりました。これは大きな発見でした。次回もこの手で頭を怒りの事案から頭を遠ざけようと思います。

5.プランBまたはCを考える

スーパーの中をぐるぐる歩きながら、自分のゴールは怒って相手に仕返しするとか意地悪するとかじゃなくて、今やってる仕事を成功させることなんだから、そのために何が今足りなくなって、どうやって埋めるのかというのを考えていたら、いくつかアイデアが出てきました。そして、もしかすると、代わりのプランの方がいいかもしれないとも思うようになりました。次のプランが出てきて、それの成果の可能性が見えると、怒りなんてどこかに飛んでいく感じでした。

6.好きな音楽を聴く

私はEDMやハウスのようなハードな音楽と、クラシックが好きです。今回はEDM系で、いくつか音楽を聴きながらスーパーをぐるぐるまわって、頭をトランス系に切り替えると、なんでも出来そうな気がしてきました。EDMやハウスミュージックのいいところは、こういうトランス状態が健全に作り出せるところだと個人的には思っています。

そして家に戻って、ご飯を作ってから、あらためてAnger Managementでネットを見ていると、Mayo ClinicからAnger Management: 10 tips to tame your templer というのが出ていて、そのなかで I から始まるセンテンスでコミュニケーションするというのが6番目にありました。 For example, say, "I'm upset that you left the table without offering to help with the dishes," instead of, "You never do any housework." と、こんな感じ。なるほどねぇ~ と思い、早速さっき怒っていた相手にメールで I was upset when I head about the news but let's work together for an alternative plan. みたいな感じでメールしたら、相手もさすがに悪いと思ったのかSkypeで電話がかかってきて、まぁ一件落着。一緒になんとか代替案を考えるという事で、雨降って地固まる、みたいな感じとなりました。

社内の相手ですが、多くの場合悪意を持って約束を守らないというわけではなく、事情があっての事ですから、そんなに怒るよりは、貸しを作ったと思った方がいいですね。 という事で、比較的うまく怒りをmanageできたと思います。

平常心に戻るまでには、今回50分かかりました。次回は30分程度で気持ちを切り替えられるようになりたいものです。

EdgeRと一般化線形モデルまわり

ちょっと仕事も含めて、EdgeRの一般化線形モデルをじっくり見る必要があったので、そのあたりのメモ。

EdgeRは以前見たときは、1因子はExact Test をしていて、多因子の時が一般化線形モデルという話だと思ったけれど、最近は1因子でも一般化線形モデルという事らしい。DESeqもそうなっているので、まぁそういうことなのだろう。

一般化線形モデルはリンク関数を使って、応答変数を変換し、線形予測子でモデルを作るようにしたもので、応答変数が正規分布をしてなくてもいいというところで応用の幅が広い(ただし指数分布族である必要はある)。

で、いきなりEdgeRでのモデルを見てみる。マニュアル18ページに出てる。ちなみに2015年10月8日にReviseされたバージョン。

 \begin{align} \log\mu_{gi} = {\bf x}^T_i \beta_g + \log N_i \end{align}

ここで \mu_{gi} g番目の遺伝子、 i番目のサンプルの観測値の期待値、{\bf x}^T_i はデザイン行列、 \beta_gは係数。そして \log N_iはサンプル i番目のライブラリサイズ、つまり総リード数。ここで、ふと思ったわけです、この \log N_iってなんでそこに居るの、と。普通教科書に出てくる一般化線形モデルは、以下

 \displaystyle \log\mu_{gi} = {\bf x}^T_i \beta_g

みたいな感じ。で、とりあえず分かりやすくするために左辺をもとの値に戻してみるかと、式変形してみると


\begin{align}
\log\mu_{gi}&={\bf x}^T_i \beta_g + \log N_i \\\
\exp(\log\mu_{gi})&=\exp({\bf x}^T_i \beta_g + \log N_i) \\\
\mu_{gi}&=\exp({\bf x}^T_i \beta_g)N_i \\\
\end{align}

で、マニュアルの14ページあたりに、以下の記載があるわけです。


\begin{align}
E(y_{gi})=\mu_{gi}=N_i \pi_{gi}
\end{align}

ここで、 y_{gi}が実際の観測されたリード数、その期待値が、総リード数に割合 \pi_{gi}をかけたものであらわされていて( \Sigma^G_{g=1}\pi_{gi}=1)なんだ、そういうことだったんですか、Robinsonさんと著者の人を思っていました。まぁ自明だから説明省くよ、って事なのかもしれませんが、なるほど、総リード数の割合のところを推定するようなモデルなのだなーとなるほどなるほどと思っていました。
バイオインフォのアルゴリズムは、当たり前といえば当たり前なのでしょうが、教科書どおりとはならないので、有る意味解読的に読まないといけませんが、おや?と思ったところが分かると、パズルが解けたような面白さですね。と、教科書には載ってないと書いて、よくよくいろいろな本を見てみると、一般化線形モデルの教科書的な久保先生のみどり本には、47ページ脚注に説明があり、138ページで同様な形のGLMが紹介されていました。あはは。。。GLM奥深し。。大学院で習った記憶はあるものの、あまり専門ではないのですが、これを機に勉強しなおそうかなとか思ったり。

まぁSlow and Steady でいきませう。

肌に付着した菌叢からの個人特定

 

これはアドベントカレンダーの企画の記事です。これを機にブログなどはじめてみようかなと。

仕事柄、比較的よく論文を読み、ほほーと思っているので、今年一番面白かった論文というのを決めるのは難しいのですが、クライムサスペンスドラマ好きな私にとっては、肌に付着した微生物の菌叢から個人を特定しようとした論文が、個人的興味と重なり印象に残りました。

論文はコロラド大学の環境系の研究室からPNASに発表された論文、

Forensic identification using skin bacterial communities.です。

 

では見ていきましょう。

 

まず最初のデータは、キーボードに付着した菌叢と指先の菌叢の比較。20歳から35歳、過去6ヶ月の間に抗生物質をとっていない健康な人。3人のうち二人は同じオフィスで勤務。キーボードは個人が専用で利用しているもので、サンプル採取30分前は誰も触れていないもの。16S rRNAを454でシークエンスしています。

 

 

論文中Fig. 1は以下のとおり。PCoAで距離はAがUnweighted UniFrac、BがWeighted UniFrac。

 

f:id:marimiya_analysis:20151219214119j:plain 

 

 

 おおお、結構似てる~ とちょっとびっくりしました。

 

そして次は、どのぐらい肌の菌叢の状態が保存されるのか。サンプル保存期間(DNA抽出までの期間)を3日と14日、そしてそれぞれ20度と-20度で保存。サンプルは健康な大人2人のわきの下から菌叢の採取。肌が選ばれているのは、2009年に発表された論文で肌が腸内や他の場所に比べて個人間の多様性が高い場所であるからで、さらにわきの下は、ある程度の菌の量が期待できるからという事でした。 たしかにわきの下にはいっぱい居そうですね。。。

 

そして結果が以下、論文のFig 2. こちらもPCoAでAがUnweighted, BがWeighted のUniFracが距離。日が変わってもPCoAは割と綺麗に分かれている。CはGenus (gen), Family (Fam), Order レベルでのrelative abundance. レベルにもよりますが、個人内の変化は個人間の変化よりも小さいのだなという印象。 

 

f:id:marimiya_analysis:20151219222431j:plain

 

 

これまでの結果は数人の結果なので、次のデータでは9人からその人が使っているコンピュータマウス表面から菌叢採取、そしてマウスを使っていた手のひらからも菌叢採取。マウス所有者の手のひらとマウス表面の距離を計算し、さらにその9人のマウスとデータベースに登録されている270人分のデータを比較して距離を計算。距離は、Unweighted UniFracとweighted UniFrac。赤がUnweighted、青がWeighted。横軸がサンプルの9人。色がついてないシンボルは、マウス所有者の手のひらと、その人が使っていたマウス。色が付いているシンボルは、マウス表面と270人の手のひらのデータ。

f:id:marimiya_analysis:20151219230531j:plain

つまりマウス所有者の手のひらと、マウス表面の菌叢は、マウスとデータベース270人分の類似度よりも似ているという事を示している。F8、M2のWeightedはちょっと似ているけれど、エラーバーにかかっていないので、ぎりぎり区別はできそうな雰囲気。

 

この論文は2010年の論文で、たまたま今年読んで個人的にほほーとなった論文でした。この論文を引用している論文は2015年12月19日段階で236本(Google Scholarしらべ)。いろいろ面白そうなものがあったので、またこのブログで紹介したいなと思います。

 

こういったメタゲノム解析以外にも、NGSを使った個人鑑定に関連するものとしては、STR(Short Tandem Repeat)を見つけるものや、ミトコンドリアのHyper-variable Region を読んで個人を特定しようとするものなどもNGSで行われているので、機会を見つけて書いていければと思います。

 

と、最新の知見でなくて恐縮ですが、こういった技術がいずれは法医学の現場で使われるのかな~など思いをはせていました。真実は小説より奇なり。論文は小説よりも面白いなと思うことがあるので、冬休みにかけていろいろ読んでみたいですね。

 

ではまた。