DIYと掛けて、引きこもりのデジタルライフと解く。その心は。。。

私の住む浅草も、8月も終わりともなれば、ブラジルと化して、町中にサンバが鳴り響き、踊る人たちの熱気で上昇気流が生まれてスコールすら降る、そんな暑い時期ではあるのですが、新しい生活様式の中、人の集まるイベントの開催は軒並み難しく、ただ単に暑いだけ(でも、ずっと家にいるからクーラー漬けになっている)、という感じですが皆さん、心身ともに健康に過ごされていらっしゃいますでしょうか。我が家の水耕栽培のアボカドもこんなに元気です。

2020年夏のデジタルDIYと言えば、あの超有名ソフトの。。。

夏の終わり、というと夏休みの自由工作、とついぞ思ってしまうのですが、どうもこのところはデジタルのDIYが流行っているようですね。しかも聞けば、そういうデジタルなDIYにハマっている人たちは軒並み、狸の口車に乗せられて何もない無人島に連れて行かれては、草むしりや魚釣りで現地通貨(無人島なのに!)の稼ぎ方を体で覚えた後に、「カブ」の売買やお金を埋めて育てたり、と言った形で稼いでみたり、化石を発掘しては博物館への寄贈を強要され、自分の住むところも最初はテントでキャンプファイヤーだったのが強制的にローンを組まされては家を買ってローンを返済し、返済が終わるとさらに巨額のローン付きでさらに大きな家に一人で住む羽目に。さらにはそんな狸たちの「島の発展のため」と唆されて、DIYというより土建業者だろう、というくらいの護岸整備や河川工事、宅地開拓を行っては島の住みやすさと人口を増やし、そのご褒美に土曜の夜にどう聞いても日本語とは思えない無人島の界隈で有名とされるお犬様の歌声を聞いて癒されている。。。癒されてるんでしょうか。

なんて書くと、発売12日で1,177万本も世界中で販売されたとも言われるソフトの多くのプレイヤーさんたちに「わかってて騙されてるの。大人になりなさい!」とお叱りを受けそうなのでこれくらいしますが、どうせデジタルなDIYをするならばリアルライフを快適にする、こんなクラウドDIYなんてどうでしょう。

あけぼの投資顧問のIT担当(笑)がそっとお勧めする、会社で使えるデジタルDIY

例えば、みんながWFHになっても毎週行われる週例会。誰が何を言ったか、記録を残しておかないとただのお茶のみ話に終わりそうですよね。みんながちゃんと会議で生産的なことを発言したよね、という記録を残しておかないと会社としてどうなの?営業や運用について会社一丸となって動いているんじゃないの?と問われかねません。

でも。実際に誰かが1時間から会話が弾んでしまってよらぬ方向に流れてしまうと2時間くらいかかってしまいます(それは当社くらい?時間と議題はあらかじめ決めてやる計画性は大事ですよね。。。)。となると、それをリアルタイムに書記としてチームの誰かが集中して(自分の言いたいことも言えずに)書き留めていくなんて、大変ですよね。どうにかしたいですよねぇ。。。

そこで、いくつかのご提案がございます(えっと、私、何屋さん?)

Microsoft、本当は好きじゃないんだけどさ

まずは、 会社に Microsoft 356を導入しましょう。おまけでExcelとWord と PowerPoint のライセンスがついてくるのと同時に、Exchange のホスティングもついてくるので会社のメールを社内のオンプレミセス・サーバーで管理しなくても良くなり、IT担当者はサーバーが落ちたりハードディスクが壊れた時の入れ替え、日曜の出社といったストレスから解放されます。

その上で、WFHでみんながビデオ会議で参加するならば、Microsoft Teams を使いましょう。会議の始まる時に、キャプション機能をオンにすると。。。喋っている言葉を文字にリアルタイムでしてくれます。すごいですね。でも、まだ英語しか聞き取りませんので、英語風に聞こえる日本語の聞き取りのように、岡崎体育くんと Monkey Majikの「留学生」の歌詞のような、ただただ面白い英文が表示されます。

ちょっと真面目にやろうか。。。

面白いだけで仕事になりませんから、キャプション機能をオフにして、普通にビデオ会議をしましょう。終わると、自社用の動画配信・共有サービスのStream にビデオ会議がアップロードされますので、その設定を見るとここにもキャプション機能が。でも、安心してください。こちらをオンにすると日本語で文字起こしをしてくれます。出来上がったテキストは動画の右側に表示されますので動画を見ながらこの文字起こしされたものを使って議事録を作る、というのもいいかもしれません。

でも、見ちゃったら会議と同じだけの時間をもう一回使うことになります。これは録音して聞いては止めてを繰り返しながら文字起こしをするのと同じでもったいない。どうせなら、文字起こしされたテキストがメールで飛んできてくれたらいいですよね。

残念ながら、Microsoft Stream で動画がアップロードされたら、ということをトリガーにしてMicrosoft Flowなどのノーコードプログラミングを含め、何かしらのプログラムを書くことがまだ出来ません(APIも解放されていません)。ですので、ちょっと手動の作業が入るものの、こんな形で実現することが可能です。ただし、今回はAmazon Web Services (通称AWS) を使いますね(個人的趣味ですが。。。)

ではクラウドDIYで楽をしましょう。レシピは次の通り

材料:
S3のバケット二つ
Transcribe
Lambdaでコードを2つほど
SES (ドメイン設定を完了させたもの)

「えっと、何を言ってるのかよくわからない(これ、投資の話だよね?)」、という声が聞こえてきそうですので、ちょっと解説しましょう。(ただの趣味の話です。。。)

S3とは、Simple Storage Service と頭文字が3つSなので S3 と呼ばれる、ただのファイル格納場所、と思ってください。
PCのディレクトリ、にあたるのがバケット(馴染みのある日本語で言うならバケツ)、と呼ばれていまして、そのバケットの中にファイルをアップロードしたり、プログラムなどが生成物をアップロードしたり、そのファイルの中身をプログラムが取り出したりできるようになっています。ある意味スマホに差し込むSDカード、みたいなものですね(あ、iPhoneじゃ無理か)。

Transcribeというのは、音声データの言葉を文字にする、文字起こしのサービスです。先ほど説明したバケットに音声ファイルを入れただけでは Transcribeは読み取って文字起こししませんし、文字起こしした結果のテキストファイルもどこか(まぁ、バケット、なんですけどね)に保管できるように準備する必要があります。

続いては Lambda。ギリシャ文字で言えばλとかΛですね。金融な人なら、ラムダって「原資産価格のパーセンテージ変化あたりのオプション価格のパーセンテージ変化」でしょ、と教科書の引用そのままのことを言いそうですが、AWSではサーバーレス・プログラミングをする環境でして、要は、S3のバケットに音声ファイルがアップロードされたら呼び出して

アップロードされたファイルをTranscribeに「これ、日本語のファイルだからね。文字起こし出来上がったらこのS3のバケツにしまっておいて」と命令する、

という手続きをプログラミング言語でかける環境です。ちなみに、ここでは 機械学習で有名になったpython や java、Microsoft の.Net (C#)、ウェブサイトを動的に表示させるためによく使われる Perl の従兄弟のような言語であるRuby などで書けますので、自分の得意な(もしくはいい機会だと思って覚えようと思った)言語で書くことが出来ます。ちなみに、私は以前はPerlやRubyでコードを書いていましたが最近はPythonで書くことが増えましたねぇ。

最後にSESですね。Simple Email Service と言って、本当にシンプルに電子メールを送受信するサービスです。単純なサービスですが、迷惑メールとして認識されないようにする仕掛けなどもちゃんとあるので当社のアンケートなどを送る時に重宝しております。

この4つをこんな風に組み合わせると、(ZoomでもTeamsでもいいですが)ビデオ会議の音声情報から文字起こしをして、その結果をメールで送ってくれます。

そして、実際のプログラミング、ですが。。。おっと、この間から文章が長いというクレームを受けているのでプログラムのコードまで掲載すると本当に一体何屋だかわからなくなる、というクレームもでそうですので、今回は割愛します。もし興味がある、という方がいれば当社ウェブマスターまでご連絡を。とは言え、実際のところ、TranscribeやSESのサンプルコードを少しだけいじればできる程度の簡単なものですので。。。

では材料費のご紹介でも

こちらですが、実際に一回のコストはと言えば 2ドルしません。会社の誰かを一人貼り付けて完璧にメモ書きをさせるのよりコストが断然安いですよね。しかも、1時間半の音声データをアップロードしてメールを受け取るまで、最初の頃は1時間以上掛かっていたのが最近では40分程度まで早くなってきていますので、この辺りはやればやるほど機械学習している、というのが実感できます。

とは言え、出来上がったテキストですが、残念ながら句読点、読点が入っていませんので読みづらいですし、仮に英単語を言おうものなら、どうしても音の似た日本語を無理やり当てはめる傾向があります。これは日本語に英語がカタカナでたくさん入った結果ですので仕方のないところかもしれません。

さらに応用編としてご紹介するのが

これの応用編として、私のお気に入りのサービスの一つでもある、Amazon Connectというコールセンター機能を使ってWFHなスタッフのPCに電話を導入しつつ、取り損ねた留守番メッセージをメールで配信、というのも出来るので色々と使い勝手はありそうです。

プログラミング教育が注目されている今、どうせプログラムで作るならば使える何か、を頑張って書くというのがやる気と実益とを兼ね備えるのでいいのではと思います。もしこれを読んで触発されて、クラウドサービスでこんな無駄遣いな面白いことができました!というものができたら教えてくださいね。 AWSにはこのほかにも翻訳サービスやテキスト読み上げサービス、さらにはブロックチェーン、IoTや衛星サービスなど、どう使うの?というものまでありますので、夏休みの壮大な自由工作にはバッチリです。

あーあ、狸じゃなくてAmazonに唆されているなぁ。話のオチもつかないし。。。(笑)