AIパーソナル・ラーニング
と実践的なガイダンス

eSearch:多機能クロスプラットフォームOCRツール、統合検索|翻訳|検索マップ|画面録画およびその他の機能

はじめに

eSearchは、xushengfengによって開発された、Windows、macOS、Linuxをサポートするオープンソースのクロスプラットフォームスクリーンショットツールです。eSearchは、OCR認識、検索、翻訳、マッピング、画像検索、画面録画などの様々な機能を統合しています。スクリーンショット、OCR認識、検索、翻訳、マッピング、画像検索、画面録画など、さまざまな機能を統合しています。eSearchはElectronフレームワークを使用して開発されており、画面コンテンツのキャプチャ、テキスト認識、翻訳など、さまざまなシナリオのためのシンプルで使いやすいインターフェイスと豊富な機能を提供します。

イー・サーチ情報ポータルelectron:書き換えバージョン(10億の機能が追加された)。


-1

 

-3

 

-4

 

機能一覧

  • スクリーンショットボックスクロップ、フルスクリーンスクリーンショット、ウィンドウとコントロールの選択、ロングスクリーンショットなどをサポートします。
  • OCR認識ローカルおよびオンラインのOCRサービスをサポートし、多言語のテキストを認識できます。
  • 検索と翻訳複数の検索エンジンと翻訳サービスの統合、スクラッチワード検索と翻訳のサポート。
  • 青写真スクリーンショットを画面に貼り付けて、比較やラベル付けが簡単にできます。
  • 地図検索画像認識技術による類似画像検索
  • ビデオレコードフルスクリーン録画、カスタムエリア録画、オーディオ録画、カメラ録画をサポートします。

 

ヘルプの使用

ウェブサイトへイー・サーチダウンロード

または右側 リリース タブを開き、システムに合ったパッケージを選択し、ダウンロードしてインストールする!

国内利用可能GitHub プロキシ高速ダウンロード

ArchLinux は AUR にインストールされています。 イー・サーチもしかしたらイー・サーチ・ギット

ウイングレット ウィジェット・インストール・サーチ

 

使用プロセス

コンピュータの画面に表示された画像をキャプチャする

ボックスクロップ、カラーピッカー、フリーハンドブラシ、ジオメトリック、モザイク、ぼかし

矢印キーでボックスの選択を調整するだけでなく、2次式の入力にも対応しており、ボックスの選択範囲を調整することができる。

自動OCR後のボックスなど、操作の即時実行後のカスタムボックスをサポートする。

また、スクロールスクリーンショットもサポートしており、水平、垂直、任意の方向にスプライスすることができます。

ビデオレコード

録画画面、カスタムサイズ、カメラ

カーソル位置とキーボードのキー入力を促す

仮想背景を設定可能

スクリーンマップ

ホイールズーム、透過、オートホーミング、マウススルー

ウィンドウサイズを変えずに画像を拡大できるため、他のコンテンツを遮ることがありません。

フィルター、変形(ミラーリングなど)はCSSで設定できます。

OCR(テキスト認識)

地元のOCRは、以下によって提供される。パドルOCRモデルでサポート。すぐに使える。

ローカルOCRサービスは、デフォルトで有効になっている、オンラインOCRを使用したい場合は、BaiduのオンラインOCRが提供されている、あなたはに頼る必要があります。チュートリアルゲインAPIキー も 秘密の鍵 2022年1月現在、百度のOCRはまだ利用可能である。無料ピックアップサービス.取得したAPIキー 歌で応える秘密の鍵 および対応するお好みのテキスト認識サービスURL ソフトウェア設定を入力し、オンラインOCRを使用するためにオフラインOCRのチェックボックスをオフにします。

 

地図検索

グーグル、バイドゥ、ヤンデックスの画像検索エンジン

AIと写真を交換するためのカスタマイズ可能なマルチモーダル・マクロモデル・インターフェース

レンダリング

OCRは翻訳後に呼び出すことができます。

Google翻訳などの無料翻訳エンジンをサポートします。また、DeepL、Baiduなどの他の翻訳エンジン用に独自のAPIを設定することもできます。 チャットGPT ネイティブのAI翻訳をカスタマイズすることもできます!

複数のエンジンを同時に翻訳し、最良のものを選択することができる。

翻訳をローカルファイルに保存するか、ネットワーク経由でAnkiのようなメモリープログラムに保存する。

オンスクリーン翻訳

マッピングウィンドウを生成し、画像のテキストを翻訳されたテキストに置き換えます。

時限翻訳を設定することができ、ビデオやゲームなどに適しています。

 

詳しい操作手順

  1. スクリーンショット::
    • ショートカットの使用 Alt + C スクリーンショットを撮るには、スクリーンショットを撮りたい範囲を枠で囲みます。
    • ボックスのサイズや位置を変更したり、クリップボードや指定したディレクトリに保存することもできます。
  2. OCR認識::
    • スクリーンショットを撮影し、OCR認識機能を選択すると、eSearchは自動的にスクリーンショット内のテキストを認識します。
    • ローカルOCRサービスまたはオンラインOCRサービスを使用することができます。
  3. 検索と翻訳::
    • スクリーンショットを撮り、検索または翻訳機能を選択すると、eSearchは選択したテキストに従って検索または翻訳を行います。
    • 検索エンジンと翻訳サービスは、さまざまなニーズに合わせてカスタマイズすることができます。
  4. 青写真::
    • スクリーンショットを撮った後、貼り付け機能を選択すると、スクリーンショットが画面に貼り付けられ、比較やラベル付けが簡単にできます。
    • マッピングのサイズ、位置、透明度を調整でき、様々な操作をサポートします。
  5. 地図検索::
    • スクリーンショットを撮影し、画像検索機能を選択すると、eSearchは画像認識技術によって類似画像を検索します。
    • 複数の検索エンジンをサポートし、正確な検索結果を提供します。
  6. ビデオレコード::
    • eSearchアプリを開き、画面録画機能を選択して、フルスクリーンまたはカスタム領域のいずれかを録画します。
    • 音声とウェブカメラの録画に対応し、複数のフォーマット(gif、webm、mp4など)に保存できます。

 

ソースコードの実行とコンパイル

git clone https://github.com/xushengfeng/eSearch.git
cd eSearch
npm install
# しゅうせん
npm run dist
# ビルド・ディレクトリーは、インストール・パッケージとそれを解凍するディレクトリーを生成する。
# うごきだす
npm run start
# テスト中にコンポーネントを調整する
npm run dev

具体的なテクニカル・ノート

 

試験

ArchLinux, KDE plasma, Xorgでテスト。

ウィンドウズ10とウィンドウズ11のテスト

macOS Catalina テスト合格

 

Q&A

クリックしても反応しないGnome

Gnomeユーザーはアピンジケータプラグインでトレイを使用する。

なぜ電子なのか

  • クロスプラットフォームは必要で、もともとWindowsで優れたスクリーンショットツールをLinuxでも体験したかったし、Linux専用はよくないので、クロスプラットフォームを選んだ。
  • qtはc++に依存しており、学習コストが高すぎる。flutterデスクトップ版はまだ成熟していない。私はjs開発の方が得意だ。
  • スクリーンショットはローカルシステムに依存しており、ブラウザでは今のところできないことだ。
  • 結局、クロスプラットフォームのソリューションはjsクラスしかなく、私はより成熟し、最も使われているエレクトロンを選んだ。

メインプロセスでJavaScriptエラーが発生

これはメインプロセスのエラーであり、さまざまな原因で発生する可能性があります。本当に有用なエラーメッセージは、次の特定のエラーであり、コードエラーです。そのため、「メインプロセスでJavaScriptエラーが発生しました」と直接検索しても、ほとんど問題は解決しません。

一般的に、ソフトウェアを再インストールして設定を復元すれば、99%の問題は解決します。一番良いのは、エラーメッセージを詳細に記録して問題フィードバックを提供する。

蓄積されたエラーとその考察、解決策:#123 #133

以前にはなかったバグを修正したアップデート版

これは通常、異なるバージョンのコンフィギュレーション間で互換性がないことが原因です。「設定」-「詳細設定」-「詳細設定」でデフォルトの設定を復元してみてください。

これで問題が解決しない場合は、issueを提出してください。

Win7、Win8のサポートは終了

ElectronはWin7とWin8を正式にサポートしなくなったため、eSearchはサポートされなくなりました。

しかし、自分でコンパイルすることも可能だ。(さんぷ一部の機能が使用できない場合があります。

AIイージー・ラーニング

AIを始めるための素人ガイド

AIツールの活用方法を、低コスト・ゼロベースから学ぶことができます。AIはオフィスソフトと同様、誰にとっても必須のスキルです。 AIをマスターすれば、就職活動で有利になり、今後の仕事や勉強の労力も半減します。

詳細を見る
無断転載を禁じます:チーフAIシェアリングサークル " eSearch:多機能クロスプラットフォームOCRツール、統合検索|翻訳|検索マップ|画面録画およびその他の機能

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語