AIツール・ライブラリ調査まとめサイト
ワクワク新しい体験を
CONCEPT
AIツールとライブラリの調査結果を通じて、AIの進化に驚かされました。私たちは、AIが私たちの生活やビジネスにどれだけのサービスを提供できるかを知りたいと思っています。AIの発展により、私たちはより幸せな未来を迎えることができると信じています。
AIを使ったWebサービス
Suno AI
歌詞で楽曲を作成
歌詞を通じてその感情を表現し、楽曲を作成してくれます。心から感じる感情を歌詞にして、ユーザーのその感情を表現した楽曲を提供してくれます。
Consensus
論文検索のサイト
論文という膨大な情報の中から、希望を抱きながら目的の論文を見つける実感を感じてほしいと思います。論文は学術関係の方たちだけでなく、一般の方でも必要な知識が得られる道を照らしてくれる存在になっていきます。
Napkin AI
テキストをイラスト化
テキストからグラフやプレゼンテーション資料用に見やすい画像を作成してくれるツールをご紹介いたします。このツールを使用することで、テキストを視覚的に表現することが可能です。例えば、データが一目で理解できるカラフルでダイナミックなグラフや、視覚的に魅力的なプレゼンテーション資料を作成することができます。
Gamma
プレゼンテーション資料作成AI
テーマやキーポイントをテキスト化することで、質の高いプレゼンテーション資料を作成してくれます。プレゼンテーションを行うためには、資料作成の段階からしっかりとした準備が必要です。的確な情報をまとめ、明確なメッセージを伝えること、この資料作成ツールで、ベースを作って、情報や画像を修正していく使い方が良いと思います。
Canva
プレゼンテーション資料修正
Canvaは機能が豊富で色々できるのですが、Gammaで作成したプレゼンテーション資料を読み込むことができるので、それをデザインをメインに修正するのに適したツールだと考えています。
GammaとCanvaとNapkin AIの3つのツールでプレゼンテーション資料を仕上げていくのが良いと思います。
tl;dv , Notta
議事録作成AI
議事録作成に特化しているAIサービスです。音声データを文字起こししてくれます。それを議事録用に要約してくれます。またその内容を基データとして、チャットで確認の質問をすることができたりします。2つのツールは各々良いところがあります。
AIプログラムで実現できたサービス
物体検出(パンの種類を判定する機能)
Yoloを使った物体検出をしましたが、近所のパンを3種類買ってきて、カレーパン、クリームパン、アップルパイ、それをAI学習させて、パンの画像を認識して判定させて写真になります。パンの写真1つずつにラベル付けする作業が大変ですが、認識できるようになると楽しいです。
音声変換(他人が話している声を自分の声に変えてしまう)
30秒ほど自分の声を録音します。「おはようございます。。。」など適当に話したデータと他の人が話しているデータを用意します。その2つのデータをプログラムに読み込ませると、他の人が話している声が自分の声で話している音声データになります。録音を日本語でしても、中国語や英語の男性の声、女性の声、に関わらず自分の声になります。
AI-OCR(手書きの発注書をプログラムに読み込ませる)
AI-OCRのサービスを試してみて、MicrosoftのAzureのAIサービスがデータをExcelっぽく扱えて便利と思いました。
特に明細表部分はセル感覚でデータを扱えるのでプログラムで扱いやすいです。
RPA(パソコン上の操作を自動化するWindowsアプリ)
パソコン上で作業している業務を自動化しようというツールです。Excelファイルを起動して、Webアプリケーションを起動し、必要なデータをコピーして、Excelに書き込んで保存する。とか、自動でできます。定例的に必要な作業があれば、昼休みなどに自動で動かしておくのも良いかと思います。MicrosoftのPower Automate を検証しました。
AWSのGenU(LLMを使ってできることをユースケースで実現)
ChatGPTのようなチャットで質問したり、文章作成、要約をお願いすることができるAWSが提供するサービスです。ユースケースごとにまとめたポータルサイトのようなアプリケーションです。直感的に使いやすいと思います。少し費用が高いですが。。。
画像生成(俳優が写っているような写真など)
画像生成でできることを調査。SDXLの技術でプロンプト指示し画像作成する方法があります。
また、SDXLをベースにLoRAの技術で画像に装飾することができます。ポーズを意識したい場合は、openpose , canny といった技術で表現でき、instantIDという技術で、顔は変えずに画像を作成する技術。プロンプトだけでは難しい表現が追加の技術でできるようになっています。
データ予測(タイタニックの乗船者の情報から生存かを導く)
AWSのSageMakerのCanvasという機能を使って、データ予測をしてみました。
ユースケースとしては、顧客の解約を予測する、在庫を効率的に計画する、料金と収益を最適化する、予定通りの配送率を向上する、がAWSの紹介ページに書かれていました。
タイタニックの乗船者データを使った生存かどうかのデータ予測をしてみました。
Excel で ChatGPT を使う (Excelはとても便利)
Excel の プラグイン に ChatGPT が使えるものがあります。それを使うと、文章の理解をしてくれます。例えば右図の解析する文ですが、文章から朝か昼か夜を認識させるようにしたものです。
詳細は画像をクリックするとリンクする note に記載していますが、朝、昼、夜と分類させています。 Excel は 2次元のセルでも便利、セル関数、VBAプログラム、ChatGPT機能、と運用的に進化しているので、とても便利です。
顔検出(今ではかなり普及してきた技術ですが)
顔検出の技術が使われている記事はよく見かけます。店舗での混み具合をカメラから取得したり、学校での写真販売は、ネット販売が主流になり、子どもの顔検索機能も入ってきています。
上記2つのパターンでは顔認識の必要な精度は異なりますが、便利になってきています。
お知らせ
2024年 11月01日
こもらめもりぃ(Webアプリ)をテスト運用中です
2024年 11月01日
このサイトを公開しました
こもらめもりぃ(YouTube , Vimeo , Web上のmp4を一括管理)
プレイリスト
登録順にサムネイル表示
動画を登録した順にサムネイル表示されます。YouTube , Vimeo , その他 のカテゴリが表示されます。再生順を変更したり、登録情報を編集したり、削除ができる画面になります。
動画登録
URLやタイトルの登録
動画の情報を登録します。動画の種類、動画のURL、タイトル名を入力し、読込みボタンを押下すると、サムネイルが表示されます。 音量をミュートにするかの設定と、動画を再生したい開始秒、終了秒を設定できます。必要なところだけを再生したい場合に設定します。
限定配信設定
関係者にリストを配布
アカウントごとにオリジナルのURLを発行し、アカウントの関係者にプレイリストを配布することができます。関係者にアカウントの登録は不要です。IDとパスワードを関係者分発行ができ、その情報をURLと一緒に配布できます。IDの発行には上限があります。
こもらめもりぃ Webアプリを使ってみる(無料)
サマークラウドの紹介ページ