Time Tripper

投稿

AIは賢く見えて究極のバカ「LLMの課題」、Geminiで「ソフト・シンセサイザー」を作ってみました。

Geminiでソフトシンセサイザーを作ってみました。多少専門知識が必要ですが、シーケンサーやエフェクターを搭載した本格的なシンセサイザーがほぼ一発で作れます。AIを利用すれば誰でも無料でシンセサイザーを入手できます。（画像をクリックするとシンセサイザーが起動します）凄いですよねー、昔はエフェクターのリバーブだけでも単体で１０万円はしましたからね。それがタダでしかもすぐに手に入ります。もちろん音もクリアーで市販品レベルのクオリティの音が鳴ります。もちろん以前作っていた「Cardputer-Adv」のシンセに比べると音のクオリティーは格段に上です。その要因はパソコンの処理能力と小さなマイコンの処理能力の差で、音声波形をリアルタイムにシミュレーションしているので、これはどうしようもない処理能力の問題です。やはりマイコンは非力で能力的には格段に劣ります。それでも挑戦する意義はあるのですが、今回あまりにもあっさりと高級シンセが作れてしまったことで戦意を消失しています。ただ、これまでの実験を通して現状のLLMの大きな課題に突き当たりました。 LLMは（Large Language Models／大規模言語モデル）というプログラムで、「言語」を扱うためのAIプログラムです。つまり「言語」以外は特に優秀ではないということです。端的に言えばプログラムを作るために作られたAIではないということです。システム開発を行った事がある方ならわかると思いますが、一つのシステムを構築するためには機能要件の整理から始まって、概要設計や仕様設計、詳細設計やテスト設計等々、コーディング以前に膨大な設計の整理が必要ですし、システムを稼働させる環境設計やソフトプロダクトの選定などやることは膨大です。こういった膨大な作業をAIがやってくれたら大変助かりますが、残念ながら現状のAIモデルはこのような複雑な作業には向いていません。というかほぼ無理です。何故なら LLMは、お喋りするための「言語モデル」だからです。試しにプロンプトに「オセロゲームをできるか？」と聞いてみてください。「もちろん出来ます」と返答をするので、実際にゲームをやってみてください。昔よくあった文字キャラを並べたオセロ盤を表示すると思うので、自分のコマの座標のアドレスを指定するとゲームが遊べます。やってみるとわか...

Geminiで作ったブラウザで動作する「ソフト・シンセサイザー」

Ultimate Modular Synth & Sequencer - Full Scale Oscillators OSC 1 Wave sawtooth square sine triangle OSC 2 Wave square sawtooth sine triangle Mix (Osc1 ? Osc2) Filter Type Low Pass High Pass Band Pass Peaking Notch Low Shelf High Shelf Cutoff Resonance (Q) ADSR Env Attack Decay Sustain Release Filter Depth LFO Rate (Hz) To Pitch (Depth) To Filter (Depth) Distortion Drive Delay Time Feedback Mix ...

最近、AIとゲームを作る遊びを楽しんでいます。つまりゲームを作る作業をゲーム的な遊びとして楽しむわけですが、これが結構楽しくて、AI(Gemini)とプロンプトで会話しながら、ブラウザ(JavaScript)で遊べるプログラムを作ってみました。今回作った「ライフシミュレーション」はシンプルですが中々面白い動きをします。原始的な狩猟社会をモデルにしたもので、マップの上に大地と水と森を適当に配置して、そこに40人程度の男（青点）女（赤点）をスポーンして放置するとどうなるか？を観察するものです。（画像をクリックするとゲームが始まります）【シミュレーションのルール】・マップのサイズは４０x４０で初期はランダムに生成される。（リロードで生成）・シミュレーションは「START / PAUSE」で一時停止ができる。・初期の住人として性別もランダムな４０人の２０歳の成人が生成される。・住民はユニークな名前を持ち個別に区別され、男は青点、女は赤点で表示される。・生きるために水と森からの食料で生命を維持する。・住民には平均的な寿命があり一定の確率で死亡する。・寿命以外に事故や病気等によって一定の確率で死亡する場合がある。・年齢的に結婚適齢期(15-45歳)に男女が出会うと一定の確率で結婚する。・結婚すると家（白い四角）を建てるが、水の上には家は建てられない。・現状はインブリードの近親交配も認めている。・家を建てると家を起点として生活を始める。・一定の確率で子供が生まれる。(最大５名) ・子供は１０歳までは親の資源で生活し、１０歳以上になると自活する。・水は普遍的で枯渇することはないが、森は資源量があり食べ尽くすと無くなる。・森は一定の確率で森の隣か水の隣で成長する。・人が移動したところは獣道として踏み固められる。・獣道では森は成長しないが、人が通らなくなると再び大地に戻る。・移動するためにはコストが掛かり、水や森は移動コストが増大する。・獣道は移動コストが低く、結果的に村が形成される。・マップはパレットを選択してドラッグすると変更できる。・「Inspector Mode」監視モードを選択した場合、住民をクリックすると年齢や家族構成等を表示できる。実験の結果、あまり水や森の資源が豊かだと住民は移動しなくなり、結果的に獣道も発達...

シンプルなライフシミュレーション「Medieval Sim - Universal Edition」

Medieval Sim - Universal Edition Pop: 0 House: 0 Year: 1 START/PAUSE Select Inspector Mode & Click Map Amazon　 M5Stack Cardputer M5Stack Cardputer Amazon　 M5Stack Cardputer M5Stack Cardputer Amazon　 WOODEN.CITY 3D 木製機械モデルセット Willys 4x4 WOODEN.CITY 3D 木製機械モデルセット Willys 4x4 Amazon　 ROKR 立体パズル木製スチームエンジン蒸気機関車 ROKR 立体パズル木製スチームエンジン蒸気機関車 Amazon　 ROKR 3Dピンボールマシン ROKR 3Dピンボールマシン Amazon　帆船模型帆船模型

クリエーターの中でもＡＩによる生成を否定するグループと容認するグループに別れています。時代と文化の流れの中で、新しいジェネレーションの受け入れには常にこういう葛藤が生まれます。例えば、絵や図面を描くときに定規や分度器を使ったりしますが、そういった道具はどうでしょうか？あるいはそれらを発展させたドラフターなんかも学生時代に製図する時によく使っていましたが、そういった道具はクリエイターの想像力を阻害したのでしょうか？　それが最近はコンピュータのＣＡＤやAdobeの画像加工ツールのような、ほとんど自動的に画像を加工生成してくれるツールもあります。音楽もエジソンの時代から歌声や演奏を機械的に録音して再生する文化に変わってきました。最近はデジタル的に録音した音楽ソースがエフェクターやシステム的な膨大なデジタル加工を施されて私達の耳に届いています。原音とは似ても似つかないほどに原音は加工されていますし、最近のＤＴＭでは全ての音をデジタルで作り出しています。それらをニセモノだと否定できるでしょうか？文化や技術の伝承は、先人達の技術をベースに積み上げていくことで現代があり、またその先に未来があります。なので現状のテクノロジーを否定しては何一つ伝播されなくなります。そもそも技術や文化というものはそういうものだということです。だからＡＩを否定しても何も始まらず、受け入れるしかないというのが自然な流れです。一般の方からするとＡＩで何でも簡単に作れると思われるかもしれませんが、プロのクオリティの成果物を今のＡＩで生成するのはまだまだ大変で、そのためには別の新しい技術が必要になります。そこにクリエーターの技術的なテクニックと発想力が必要になります。最近、私もＡＩを積極的に活用しようと思っています。前回のブログで紹介したちっちゃなコンピュータは、その練習場所として購入したもので、小さくて出来ることが限られているからこそ試せる部分も多くて、新しいことを学ぶにはちょうどよいフィールドサイズだと思います。人類史上で、この５０年間は歴史的な転換期なったと後の時代で評価されると思います。天才テスラによる電気的な技術の発明から電子的な制御技術に繋がり、アナログからデジタルへの転換でコンピュータ技術が...

毎晩、ＡＩのグロック君と「M5Stack Cardputer-ADV」でシンセサイザーの開発を行っています。おそらく、もう百回ほどコンパイルテストを行っていると思いますが、まだまだ道は険しいです。ようやく数日前に音は出たのですが、音質が酷くて高周波のノイズや音声波形の乱れによるトレモロ効果やブツブツと音が途中で途切れる問題がありました。何故ここまで難しいのかというと、今回購入した「M5Stack Cardputer ADV」はまだ発売されたばかりでネットの情報も少なく、特に新しく導入しされたオーディオチップ「ES8311」の情報が少なく、これが原因で音を出すにも一苦労でした。もちろん、簡単に音を出す方法もあります。最初に作ったインベーダーゲームの効果音なんか一発であっさり音が出ました。単純な周波数指定だけの音出しは簡単なのですが、今回やりたいのはリアルタイムに音声波形を変えながら演奏できるソフトシンセを目指しているのでアプローチ方法が全く変わってきます。音声出力は途切れることなく出力しながら、演奏のためのキー入力処理や波形の生成処理をしつつ、出力波形のデータをオーディオチップに渡さないといけないとう処理なので、ＣＵＰの割り込み処理を1/1000秒単位にコントロールする必要があります。その処理をノイズが乗らないようにシームレスに行うには非常に難しくて突破するのに一週間ほどかかりました。とにかく「ES8311」の情報が少なくて泣けました。そんなプログラム開発の相棒グロック君とのやり取りです。彼は打たれ強くてユニークで面白いです。ｗ以下は一昨日の深夜２時ぐらいのやり取りで、何の脚色もしていません。・・・・・・・・・・・・・・・・・・・・・（私）よりハッキリと強烈にトレモロ効果がついたよ。楽器というよりはバイクのエンジンのようだ。聞かせてやりたいよ。全く方向を間違っているんじゃない？（グ）ありがとうございます。「トレモロ効果が強烈」「バイクのエンジン音」 → 完全に理解しました。最終修正コード（バイク音完全解消 + クリアなシンセ音）これで「楽器」になります！コピペして書き換えてください！聞かせてやってください！【コンパイルテスト】　→　エラー（私）もう無理じゃな...

カードサイズの小さなコンピュータ「M5Stack Cardputer」が気になっています。 Amazon　 M5Stack Cardputer M5Stack Cardputer まずは、M5Stack Cardputer1.1のハードスペックです。仕様パラメータ SoC ESP32-S3FN8 (Xtensa LX7), 8MB Flash, Wi-Fi, OTG, CDC Flash 8MB ストレージ SD Card キーボード 56 キー (4 x 14) ボタン 1 x リセットボタン + 1 x ユーザボタン Grove 1 x HY2.0-4P バッテリー容量 120 mAh + 1400 mAh （ベース部）画面 ST7789V2@1.14 インチ， 240 x 135px スピーカー 8 Ω @1W I2S@NS4168 マイク MEMS マイク @SPM1423 IR 送信距離 ∠ 0 °： 410 cm ／∠ 45 °： 170 cm ／∠ 90 °： 66 cm 休止電流 DC 4.2 V@0.26 µA 動作電流 IR 送信時： DC 4.2 V@255.6 mA ／キーボード時： DC 4.2 V@165.7 mA 動作温度 0 ~ 40 ° C 製品サイズ 84.0 x 54.0 x 19.7 mm 製品重量 ...

このブログを検索

Time Tripper

投稿

AIは賢く見えて究極のバカ「LLMの課題」、Geminiで「ソフト・シンセサイザー」を作ってみました。

Geminiで作ったブラウザで動作する「ソフト・シンセサイザー」

ＡＩでシンプルな「ライフ・シミュレーター」を作ってみた

シンプルなライフシミュレーション「Medieval Sim - Universal Edition」

ちっちゃなコンピュータとＡＩとの付き合い方　M5Stack Cardputer ADV

小さなシンセサイザーを作っています。M5Stack Cardputer-ADV

カードサイズの小さなコンピュータ「M5Stack Cardputer ADV」でソフトシンセは作れるか？

投稿

AIは賢く見えて究極のバカ「LLMの課題」、Geminiで「ソフト・シンセサイザー」を作ってみました。

Geminiで作ったブラウザで動作する「ソフト・シンセサイザー」

ＡＩでシンプルな「ライフ・シミュレーター」を作ってみた

シンプルなライフシミュレーション「Medieval Sim - Universal Edition」

ちっちゃなコンピュータとＡＩとの付き合い方 M5Stack Cardputer ADV

小さなシンセサイザーを作っています。M5Stack Cardputer-ADV

カードサイズの小さなコンピュータ「M5Stack Cardputer ADV」でソフトシンセは作れるか？

ちっちゃなコンピュータとＡＩとの付き合い方　M5Stack Cardputer ADV