AIパーソナル・ラーニング
と実践的なガイダンス
サイバーナイフ用ドローイングミラー

WeChatの音声メッセージはこんな風に再生できる?初心者でもDevboxを使えば、簡単に公開番号の音声をテキストに変換することができます!

多くの人はWeChatの音声入力を直接使いたいと思うだろう。

一般的なものとは対照的だ。 .mp3 歌で応える .wav フォーマットが異なり、WeChatの音声入力はデフォルトで .amr フォーマット


以下は、WeChatから開発者サーバーが受信したWebhookで、公開番号のユーザーから音声メッセージを受信したことを示しています。 .amr.

WeChatの音声メッセージはこんな風に再生できる?初心者でもDevboxを使えば、簡単に公開番号の音声テキスト化が実現できます!-1

多くのSTT(Speech to Text)サービスは前者のみをサポートしている。 .amr 形式に変換される。 .mp3 フォーマットは?

 

処方

最初は Laf これは後に Laf にある。 サービスとしての機能 などのファイルシステムの使用をサポートしないソリューション。 fs サーバー上のファイルを操作する。

そんな時、GitHubで解決策を見つけた。[2]を開始する。 express サービスを使用します。 fluent-ffmpeg そうしれいかん .amr コンバート .mp3その後、ファイルは発信者が使用できるようにサーバーに一時的に保存される。

このソリューションは、サーバーにあらかじめ FFmpegさもなければ fluent-ffmpeg は利用できない。

「これは単純なFunction-as-a-Serviceではない」と私は思った。私自身はバックエンドとオペレーションの人間で、以前はユーザーとのフロントエンドのインタラクションに重点を置き、サーバーレス一辺倒だった。今、これは私にとってちょっとした挑戦だ。

しかし、少し前に公開されたシーロスのことを思い出した。 Devboxその埋め合わせのための宣伝のようだ。 Laf このようなファンクション・アズ・ア・サービスでは不十分だ。

"Devboxで上に書いたようにサービスをデプロイできないだろうか?"こうして変革(ピット・ステップ)が始まる。

 

ボディ・センスを使ったデブボックス

Devboxとは何かについては、序章をご覧いただきたい:Sealos Devboxリリース:クラウドネイティブ開発環境のデプロイ

WeChatの音声メッセージはこんな風に再生できる?初心者でもDevboxを使えば、簡単に公開番号の音声テキスト化が実現できます!-1

ここでは、特にその開発経験についてお話ししたいと思う。

 

というのも、それはあなたの認識に大きく影響するからだ。 Devbox 私が理解し、回り道をしてきたので、これは使い方のヒントや結論の段落であり、私が議論するためにここに置いたものである。

ある Devbox その上、すべての開発プロセスはダイレクト.

最初はとても使いづらかったけど、ローカルのIDEと同じように使えるよ Connect to SSH Host 関数を見てみよう。 クロード これについてのメモだ:

WeChatの音声メッセージはこんな風に再生できる?初心者でもDevboxを使えば、簡単に公開番号の音声テキスト化が実現できます!-1

 

Devboxを使用すると、次のようなことを避けることができます。 记录服务器 IP 或域名 / 输入 SSH 端口号 / 输入服务器用户名或密码(或SSH密钥) 手続きは下のボタンを1回押すだけ。

WeChatの音声メッセージはこんな風に再生できる?初心者でもDevboxを使えば、簡単に公開番号の音声テキスト化が実現できます!-1

 

私が使っているのは ウィンドサーフ 最初のクリックの後、私のウィンドサーフはリモートサーバーに接続しようとしました。その後、IDE上で行った変更は、実際にリモートサーバーを操作することになります。

ランニングを含む pnpm i あるいは他のオーダー、すべてだ。

さらに重要なのは、コマンドの実行を含むすべてのアクションが、DevboxのWeb UIに表示されることです。 发布版本 を含む)すべてが、このような事態に陥った。命令的运行これは仮想マシンの現在の状態のスナップショットに相当する。

WeChatの音声メッセージはこんな風に再生できる?初心者でもDevboxを使えば、簡単に公開番号の音声テキスト化が実現できます!-1

そのため、Devbox開発環境にインストールしたすべての依存関係や基礎となるソフトウェア(たとえばFFmpeg)にある。 发布版本 その後、本番環境ではまったく手順をたどる必要はなく、箱から出してすぐにすべての前提条件がインストールされた。

このことを理解したとき、あなたはようやくその理由を理解することになる。 Devbox 世間は常にこう言ってきた。『やっと、本番環境での依存関係の問題やバージョン番号の衝突を心配する必要がなくなった。なぜなら、本番環境は開発環境の完全な鏡だからだ!

 

ハンズオン

以上のような理解で Devbox の知識があれば、実践部分は比較的簡単である。

 

1.Devboxでexpressを選択

WeChatの音声メッセージはこんな風に再生できる?初心者でもDevboxを使えば、簡単に公開番号の音声テキスト化が実現できます!-1

 

2.IDEで開く

前述したように VS Code / Cursor / Windsurf 開発用サーバーに接続する。

サーバーに接続後、すべてのファイルを選択します。 Cmd + Aデフォルトのテンプレートファイル全体を削除してください。

 

3.コードのダウンロード

を選んだだけだ。 express テンプレートは、デフォルトの git, node 歌で応える pnpm すべて設置済み。

それでは、ターミナルを開いて git ダウンロードコード

git clone https://github.com/yenche123/liubai.git

SSHホストのIDE上でコマンドを打つと、少し遅延を感じますが、それはリモートサーバー上の端末を操作しているからで、当然遅延が発生します。

以前の開発経験では、ローカルで開発し、コードをパッケージ化してサーバーにアップロードしていた。 Devbox そして、すべてをサーバー上で運用し、デベロップメント・アズ・デプロイメントを行う。

 

4.FFmpegをインストールする

Terminalで以下のコマンドを入力し続ける。 FFmpeg の設置。

sudo apt update && sudo apt upgrade # press Y to continue
sudo apt install ffmpeg # press Y to continue
ffmpeg -version # verify if installed successfully

最後の行で、インストールが成功したかどうかを確認できる。

繰り返しますが、ソフトウェアはイメージに直接含まれているので、このインストール後に本番環境で手順をたどる必要はありません。かなりすごいことでしょう?

 

5.entrypoint.shを書く

WeChatの音声メッセージはこんな風に再生できる?初心者でもDevboxを使えば、簡単に公開番号の音声テキスト化が実現できます!-1

我々はルート・ディレクトリにいる。 liubai/ 兄弟ポジション(上図)は entrypoint.sh ファイルには次のように書かれている。

#!/bin/bash
cd /home/Devbox/project/liubai/liubai-backends/liubai-ffmpeg
pnpm dev

このファイルは、本番環境のサーバーに、マシン起動後に希望するサービスを開始する方法を通知するためのものである。

ここでは、まず保存先フォルダーを探すようマシンに指示する。 liubai-ffmpeg 次に pnpm dev コマンドで起動する。 express サービス

 

6.entrypoint.shの認証

また、ルート・ディレクトリで以下のコマンドを実行する。 entrypoint.sh 実行可能パーミッションを追加する。

chmod +x entrypoint.sh

 

7.依存関係のインストール

開けてみよう。 liubai-ffmpeg ディレクトリに必要な依存関係をインストールする:

cd /home/Devbox/project/liubai/liubai-backends/liubai-ffmpeg
pnpm i

 

8.開発環境でのサービスの開始

ルート・ディレクトリーに戻って、もう一度サービスを開始するシミュレーションをしてみよう:

cd /home/Devbox/project
bash entrypoint.sh

 

WeChatの音声メッセージはこんな風に再生できる?初心者でもDevboxを使えば、簡単に公開番号の音声テキスト化が実現できます!-1

上記のようなプリント・メッセージが表示されるということは、開発環境を起動したマシン上で amr 反復行動クラシファイア mp3 サービスの

 

に戻ろう。 Devbox ウェブ・ウイで、パブリック・アドレスをコピーする。

WeChatの音声メッセージはこんな風に再生できる?初心者でもDevboxを使えば、簡単に公開番号の音声テキスト化が実現できます!-1

 

次に、ブラウザのアドレスバーに次のように入力する。 /hello以下の画面が表示されれば、指定されたサービスが正常に開始されたことを意味する。

WeChatの音声メッセージはこんな風に再生できる?初心者でもDevboxを使えば、簡単に公開番号の音声テキスト化が実現できます!-1

今度はスプライシングだ。 /new?url=你的amr文件&id=当前时间戳(毫秒)

そして amr コンバート mp3 サービスだ!

 

9.本番環境への展開

Devbox web uiをクリックします。 发布版本.

WeChatの音声メッセージはこんな風に再生できる?初心者でもDevboxを使えば、簡単に公開番号の音声テキスト化が実現できます!-1

リリース処理中にIDEが一時的に切断されるのは正常なことです。

投稿後 上线最小構成に従って「完了」をクリックするだけです。

数分待つと、本番環境の amr コンバート mp3 サービス

 

Devboxでgitコミット

Devbox では、開発後に git commit を行いたいことがあります。この場合、リモートサーバーがリモートリポジトリにプッシュアクセスできる必要があります。

GitHubを例に、私が遭遇した例を紹介しよう。

ターミナルで実行 git push origin 你的分支名 そうすると、Terminal はブラウザで GitHub ページを開き、IDE から認証コードを入力するように指示します。

WeChatの音声メッセージはこんな風に再生できる?初心者でもDevboxを使えば、簡単に公開番号の音声テキスト化が実現できます!-1

 

WeChatの音声メッセージはこんな風に再生できる?初心者でもDevboxを使えば、簡単に公開番号の音声テキスト化が実現できます!-1

 

ただし、この操作は認証に失敗することがあり、IDEの右下隅に Personal access tokens 以下のように認証を行ってください:

WeChatの音声メッセージはこんな風に再生できる?初心者でもDevboxを使えば、簡単に公開番号の音声テキスト化が実現できます!-1

 

オーソライズが完了したら git push 少しなら大丈夫だろう。

 

今すぐ体験

上記のサービスはすでに「ホワイトノート」に導入されており、「ホワイトノート」のWeChat公開番号に従って音声を送信すると、上記のサービスに電話をかける。 amr 反復行動クラシファイア mp3 サービス

現在、大手モデルベンダーである7つのタイガースの中で、ミニマックスは開発者に以下のことを可能にしている。 messages に直接接続する。 mp3 フォーマル base64.WeChatでマルチモーダルをネイティブに使う!

 

上記をまとめると、以下のようになる。 Devbox 終了 amr 反復行動クラシファイア mp3 サービスの

本稿の核心は ボディ・センスを使ったデブボックス その節では、次のことを簡単に紹介した。 Devbox 従来の開発との違い Connect to SSH Host そのため、私たちはリモートサーバーを直接操作し、ソフトウェアのインストールとコアコードの開発を完了した。

による Devbox 基礎となるコンテナの最適化により、次のようなことが可能になる。デベロップ・アズ・ユー・デプロイ開発後、開発サーバー上で直接結果を検証できる。 Devbox 仮想化装置全体のスナップショットを取る機能は、以下の問題を解決する。 开发环境 歌で応える 生产环境 これにより、依存関係や基盤となるソフトウェアをインストールするプロセスを踏むことなく、本番環境ですぐに結果を出すことができる。

無断転載を禁じます:チーフAIシェアリングサークル " WeChatの音声メッセージはこんな風に再生できる?初心者でもDevboxを使えば、簡単に公開番号の音声をテキストに変換することができます!
ja日本語