と尋ねている:
AIに構造化データ(Excel/CSV)をより良く分析させるには?内容が長くて、ちょっと投げ出した感じがする。
答えてくれ:
コンテキスト・ウィンドウの制限により、AIは非常に長いコンテンツを一度に処理することができない。.さらに、大規模な言語モデル自体が数学的な演算を得意としていないため、次のような問題もある。提供された構造化データに基づいて直接計算することはできない。.現時点での最善の使い方は、コードと組み合わせて使うことだ。
例えば、ChatGPTやClaudeのようなツールは、自動的に次のようなことを助けてくれます。データを分析するコードを生成するまた、バッチ処理も可能です。ご希望であれば、独自のコードを書いて分析を実装することもできます。
ラショナル
- AIへのプロンプトでは、データの構造(カラム名やデータ型など)を説明するか、小さなデータ例を示してください。入力が長すぎて情報の一部が失われないように、完全なデータを直接貼り付ける必要はありません。
- ニーズの明確化:統計表やグラフの作成、特定の指標の計算など、データを使って何をしたいのか、何を分析したいのかをAIに明確に伝える。
- AIにコードを生成させる:ニーズに基づき、AIにデータを読み取り分析するコードを書かせる。こうすることで、AIはデータを完全に処理し、コンテキストウィンドウの制限を気にすることなく、正確な結果を生成することができる。
典型例
例えば、自分のXのアクセスデータをcsv/excelファイルにエクスポートして、各日のアクセス数を記録して、そのデータをChatGPT(クロードでOK)に提出すると、「1年間の自分のツイートデータを分析して、どの月のアクセス数が一番多かったか?どの週のアクセス数が一番多かったか?どの日のアクセスが最も多かったか?
チャットGPT まず最初に行うのは、データをサンプリングして、自分のデータ構造がどのようなものかを知ることだ。
その後、要件に従ってコードを生成し、最後にコードを実行して結果を得る。
クロード ChatGPTはPythonを使い、ClaudeはJavaScriptを使うという違いだけで、似ています。
クロードは結果を返す:
このデータの分析をお手伝いします。分析ツールを使ってCSVファイルを処理し、訪問(プロフィール訪問)データをさまざまな時間軸で見ることができます。 // CSVファイルの読み込みと解析 const fileContent = await window.fs.readFile('account_overview_analytics 2.csv', { encoding: 'utf8' }); papaparse' から Papa をインポートする; const parsedData = Papa.parse(ファイルコンテンツ, { }) header: true, dynamicTyping: true, { }. dynamicTyping: true、 skipEmptyLines: true }); const data = parsedData.data; // 月ごとにグループ化する const monthlyVisits = {}; data.forEach(row => {) const date = new Date(row.) const monthKey = `${date.getFullYear()}-${String(date.getMonth() + 1).padStart(2, '0')}`; if (!monthlyVisits[monthKey]) { { 月次訪問数[monthlyVisits[monthKey]) monthlyVisits[monthKey] = 0; } monthlyVisits[monthKey] += row['Profile visits'] || 0; }. }). // 最も訪問数の多い月を見つける const maxMonthVisits = Object.entries(monthlyVisits) .sort((a, b) => b[1] - a[1])[0]; // 最も訪問数の多い月を見つける。 console.log('Highest monthly visits:', maxMonthVisits); // 週ごとにグループ化する const weeklyVisits = {}; data.forEach(行 => {) const date = new Date(row.Date); const weekNumber = getWeekNumber(date); const weekKey = `${date.getFullYear()}-W${String(weekNumber).padStart(2, '0')}`; if (!weeklyVisits[weekKey]){。 weeklyVisits[weekKey] = 0; } weeklyVisits[weekKey] += row['Profile visits'] || 0; }). // 最も訪問数の多い週を見つける const maxWeekVisits = Object.entries(weeklyVisits) .sort((a, b) => b[1] - a[1])[0]; // 最も訪問数の多い週を見つける。 console.log('Maximum weekly visits:', maxWeekVisits); // 最も訪問数の多い日を見つける const dailyVisits = data.map(row => ({ {. date: row. visits: row['Profile visits'] || 0 日付, visits: row['Profile visits'] || 0)); const const maxDayVisits = dailyVisits.sort((a, b) => b.visits - a.visits)[0]; console.log('Highest daily visits:', maxDayVisits); // ヘルパー関数:日付の週番号を取得する 関数 getWeekNumber(date) { // ヘルパー関数:日付の週番号を取得する。 const d = new Date(Date.UTC(date.getFullYear(), date.getMonth(), date.getDate())); const dayNum = d.getUTCDay() | | 7; const dayNum = d.getUTCDay() | 7; d.setUTCDate(d.getUTCDate() + 4 - dayNum); const yearStart = new Date(Date.UTC(d.getUTCFullYear(),0,1)); return Math.ceil((((d - yearStart) / 86400000) + 1)/7); } 分析に基づくと 1. 最もアクセス数の多い月は2024年2月で、総アクセス数は25,317件。 2. 最もアクセス数の多かった週は、2024年第7週(2月中旬)で、9,537件。 3. 最もアクセス数の多かった日は、2024年2月16日(金)で、4,203件のアクセスであった。 特に2月中旬の週は、あなたのアカウントにとって2月が最も良い月だったようですね。2月16日に何か特別なコンテンツを投稿して訪問数が急増したことを覚えていますか?今後のコンテンツ戦略のヒントになるかもしれません。 具体的なコンテンツタイプの分析やその他の指標(インタラクション率、フォロー率など)など、より詳細な情報をご希望の場合は、さらに詳しく分析することも可能です。
ChatGPT。
pdとしてpandasをインポートする # データを分析するためにCSVファイルをロードする file_path = '/mnt/data/account_overview_analytics (2).csv' data = pd.read_csv(file_path) # 最初の数件を表示する 行 データの構造を理解する data.head() 結果 結果 日付 インプレッション いいね! エンゲージメント ブックマーク シェア 0 2024年12月27日(金) 17955 65 405 29 1 1 2024年12月26日(木) 1126219 2870 21818 1386 65 2 2024年12月25日(水) 1657311 4312 19589 1544 78 3 2024年12月24日(火) 401326 1424 12266 749 41 4 2024年12月23日(月) 467837 1528 16703 782 43 新規フォロー フォロー解除 返信 リポスト プロフィール訪問 投稿作成 0 4 0 10 10 35 0 1 206 39 198 427 1099 1 2 361 23 179 667 1700 3 3 141 15 153 272 517 5 4 96 27 217 260 559 2 ビデオ視聴回数 メディア視聴回数 0 242 346 1 22707 88041 2 12096 23161 3 17368 42005 4 34821 77995 このデータセットには、Date(日付)、Impressions(印象)、Likes(いいね!)、その他のカラムが含まれています。 に関するご質問にお答えします。 1.インプレッション数が最大の月:データを月ごとにグループ化し、総インプレッション数を計算します。 2.インプレッション数が最大の週:データを月ごとにグループ化し、総インプレッション数を計算します。 2.最大インプレッション数の週:週ごとにデータをグループ化し、総インプレッション数を計算します。 3.最大インプレッション数の日:週ごとにデータをグループ化し、総インプレッション数を計算します。 3.インプレッション数が最も多い日:インプレッション数が最も多い1つの日を見つける。 計算を進めてみよう。 # 'Date'カラムをdatetime形式に変換してグループ化しやすくする。 data['Date']=pd.to_datetime(data['Date']、format='%a, %b %d, %Y') # 月と週のヘルパー列を追加する data['Month'] = data['Date'].dt.to_period('M') data['Week'] = data['Date'].dt.isocalendar().week # 月ごとにグループ化し、インプレッションを合計する monthly_impressions = data.groupby('月')['インプレッション'].sum() # 週ごとにグループ化し、インプレッションを合計する weekly_impressions = data.groupby('週')['インプレッション'].sum() # 最大インプレッション数の日を見つける max_day = data.loc[data['インプレッション'].idxmax()]. # 結果を抽出する max_month = monthly_impressions.idxmax() max_month_value = monthly_impressions.max() max_week = weekly_impressions.idxmax() max_week_value = weekly_impressions.max() max_day_date = max_day['Date']. max_day_value = max_day['Impressions']. (max_month, max_month_value, max_week, max_week_value, max_day_date, max_day_value) 結果 (期間('2024-02', 'M')、 22484999, 7, 7480737, Timestamp('2024-02-16 00:00:00'), 2753640) ツイートのインプレッションの分析です。 1.インプレッション数が最も多かった月:2024年2月、合計22,484,999インプレッション。 2.インプレッション数が最も多かった週:第7週(2024年2月中旬)、合計22,484,999インプレッション。 2.インプレッション数が最大となった週:第7週(2024年2月中旬)、総インプレッション数7,480,737。 3.最大インプレッション数の日:2024年2月16日、2,753,640インプレッション。 より詳細な視覚化、またはさらなる内訳をお望みでしたら、お知らせください!
上記のAIツールにアクセスできない場合は、お住まいの国の類似製品を使ってみてください:知的好奇心を刺激するスピーチ 殷唐と協議する(紀元前16世紀) いずれもEXCELファイルのデータ分析に対応したAI対話ツールを備えている。