記事の対象者は以下の方を想定しております。
次元圧縮とは多次元の情報をより少ない次元に落とし込むことであるが、これはビジネス的には、完結に説明するというニュアンスに近い。 コンピューターが計算するうえで、完結に物事を説明するために必要な部分に絞っていく行為が次元圧縮である。
計算式で捉えるべきポイントの説明は、インターネット上に多くあるが、要諦としては、合成関数の微分が肝であると捉えるべき。 合成関数とは y=(x3 + x + 1) という式を 微分すると dy/dx = 3x + 1 となる。少し複雑な式を例にすると z=y5=(x3 + x + 1)5 を微分すると、zの説明変数はyでありyの説明変数がxであるという式であった場合、z=f(y) y=g(x) つまりzはyで説明されていて、yはxで説明されるという場合に関数の中に関数が入っていることとなり、zは結果としてxで説明されている。 これが合成関数である。 合成関数を微分することで、どのような時に何が反応するかを数学的に捉えられる。 平たくいうと、結果として影響箇所を特定していることに繋がっている。
ディープラーニングは研究や活用事例に関して、非常に多岐にわたることが理解するうえでは情報過多となっていると捉えております。 シンプルに回帰と分類に強いということは、分析に強いことになります。応用すると判断にも使えるかもしれません。一方、判断するためのルールが明文化されている場合は、素直にルール通りに処理すればいいだけですのでディープラーニングの出番はありません。つまり、暗黙知のような明文化できないことを説明できることが強みとなります。
意外と思われるかもしれませんが、エクセルで作成できる点が御伝えしたい点です。
入門や理解という点ではこの方法を強くお薦め致します。 自分で手を動かして体験することが、仕組を理解するうえでは一番重要かと思います。シンプルなものであれば、本を読みながら指示に沿って1~2時間程度の作業で、動作を確認できます。
著者が体験したことですが、上記でエクセルで触ってからが、身になるまでという点では長かったと感じております。 人それぞれではあると思いますが、焦る必要はないと思いますし、長い付き合いの始まりだと捉えて頂いたほうが気が楽かなと思います。
現実的には、人間の代替として何にでも使えるものはないと捉えております。
研究の進展と実社会での適用はまさにこれからが大波です。 一方、企業はディープラーニングを使いこなす前に、DX対応ということであっても充分すぎる工数削減が既に見込まれております。銀行でのDX適用でのコスト削減額が報道等でもあるように、企業はまずはルール化されている業務についてのDX対応から取り組んでいくことが優先されます。
ディープラーニングを実施する場合には、目的とあるデータを考えますが、実際のデータ形式が加工を要するケースが多く見受けられます。 具体的には漢字の氏名が、苗字と名前で間が全角であるケースと半角であるケースとスペースがないケースがあります。
これが一番の壁であると思っております。あなたが有用だと信じてくれているディープラーニングを組織が受け入れ使いこなすことにGAPを感じることとなるかもしれません。 何かを始めるときのリーダーシップは誰がとるべきでしょうか。 あなたがディープラーニングに将来性を感じた際に、独学で勉強し会社の理解を得るに際し、我々が力になれる点があると信じております。