실험: 워드프레스 사이트 전체 콘텐츠를 AI 어시스턴트의 "지식 기반"으로 변환하기

AI 실습 튜토리얼6개월 전 업데이트 AI 공유 서클
1.8K 00

요인(효과를 주도하는 요소)

수석 AI 공유 서클은 다음을 입력하여 웹 사이트에서 찾을 수있는 많은 "실용적인 명령"과 다양한 "AI 도구"를 편집했습니다.바이워드검색을 위한 매칭으로 필요한 정확한 리소스를 찾을 수 없습니다. 웹사이트에 우수한동영상 도구 생성찾을 수 없다는 것은 참을 수 없는 일입니다.

实验:将WordPress全站内容转换为AI助手的

 

웹사이트를 개발할 능력이 부족하면 외부 기능에 의존하여 검색할 수 있습니다:

검색 엔진에 의존하여 "사이트 검색"방법을 사용하여 문제를 해결하는 것은 약간 번거롭고 콘텐츠가 전체에 포함되지 않은 것 같습니다:

实验:将WordPress全站内容转换为AI助手的

또는 다음과 같이 입력하세요: site:aisharenet.com SEO

 

물론 웹사이트 콘텐츠를 시맨틱 검색으로 직접 변환하고 이를 사용할 수 있는 좋은 인터페이스를 제공할 수 있는 능력이 없기 때문에 이 문제가 중심이 되고 있습니다:

웹사이트 콘텐츠를 쉽게 검색할 수 있는 지식창고로 변환하는 방법을 알아봅니다.

 

 

콘텐츠 분석

헤더 영역의 AI 도구 및 사용 지침은 대체로 콘텐츠의 특징을 명확하게 설명하는 반면, 콘텐츠 영역은 더 자세히 표시되지만 다음과 같이 보일 수 있습니다.중단텍스트가 검색 품질에 영향을 미칩니다. 또한 콘텐츠에는 독자들에게 미리 보기를 제공하고자 하는 이미지가 있습니다.

 

AI 도구 콘텐츠의 예

实验:将WordPress全站内容转换为AI助手的

명령의 내용을 사용하는 예

实验:将WordPress全站内容转换为AI助手的

 

 

검색 전략에 대한 생각

 

1. 의미 검색에 참여하기 위해 제목과 내용이 전체 단락으로 혼합되어 있습니다.

장점: 완벽한 콘텐츠

단점: 콘텐츠가 너무 많으면 검색이 부정확해집니다.

 

2. 제목만 검색한 다음 제목을 기준으로 콘텐츠 지식을 인용합니다.

장점: 정확한 검색

단점: 유효 검색 범위 감소

 

3. 큰 모델에 제목과 콘텐츠를 입력하여 QA 쌍으로 분할합니다.

장점: 유효 검색 범위가 크게 향상됩니다.

단점: 처리 비용 및 시간 비용 증가, 원본 텍스트의 중요한 내용과 구조가 손실됩니다.

추신: 개발 경험이 없어도 여기서는 설명하지 않은 DIFY 프로젝트 일괄 생성 QA 쌍을 배포할 수 있습니다.

 

4. 지식 매핑

콘텐츠가 적합하지 않으면 무시합니다.

저는 지식 그래프를 지원하지 않는 무료 오픈 플랫폼에 의존하여 인텔리전스를 편집하려고 합니다.

 

선택적 검색2은 간단하고 효율적입니다. 유효 검색 범위는 줄어들지만 지속적인 반복을 통해 점진적으로 최적화할 수 있습니다.

콘텐츠 주제도 검색에 관여할 필요는 없으며, 시맨틱을 따라 검색하는 한캡션이렇게 하면 긴 컨텍스트를 처리할 때 큰 모델에서 생성되는 예외의 수가 줄어들고 URL을 반환하면 보다 완전한 읽기가 가능합니다.

 

 

검색 도구 캐리어

 

시맨틱 검색을 구현하는 데 사용되는 3자 플랫폼은 무엇인가요?

메타베이스, 스마트 스펙트럼, 버클, 웬신 등 지식창고를 지원하는 무료 플랫폼이 시중에 많이 나와 있습니다. 여기서는 검색을 위해 QA 쌍 가져오기를 지원하는 플랫폼을 선택하겠습니다.

QA 쌍 검색: 질문 A를 다시 빅모델로 검색하여 질문 A에 해당하는 답변 B를 반환하고, B를 참조 콘텐츠로 사용하여 사용자의 질문에 답변합니다.

어떤 플랫폼이 더 나은지, 어떤 의미론적 이해가 더 나은지는 여기서 고려되지 않으며, 기본적으로 기본 성능은 표준으로 간주됩니다.

 

사용자는 어디에서 사용하나요?

메인 푸시는 공개 푸시이므로 사용자가 공개적으로 검색할 수 있습니다.

 

스마트 스펙트럼도 좋지만, 저는 QA 규칙 처리에 대한 명확한 운영 지침이 있는 웬신 인텔리전트 바디를 선택했습니다. 동시에 고객 확보를 위해 Wenshin Intelligent Body를 Baidu에 게시할 수 있습니다. 추천 자료:킬러 트래픽 포털: 장기적으로 웹사이트와 공중전화 번호의 외부 트래픽을 확보하기 위한 AI 인텔리전트 바디 사용

 

 

운영 튜토리얼

 

1. 워드프레스에서 XML 파일 내보내기

实验:将WordPress全站内容转换为AI助手的

 

2.XML을 MD 형식으로 변환

 

2.1 다운로드하려면 여기를 클릭하세요.블로그2MD 프로젝트(수학.) 속D:\222\blog2md 디렉터리에 압축을 풉니다.

 

2.2 blog2md 디렉터리의 시작 부분에 있는 마우스 오른쪽 버튼을 클릭하여 셸 터미널을 엽니다.

实验:将WordPress全站内容转换为AI助手的

 

2.3 종속성을 설치해야 하는 경우 다음 명령을 입력합니다.

安装命令:
npm install xml2js
验证命令:
npm list xml2js

 

2.4 내보낸 XML 파일의 이름을 111.xml로 지정하고 D:\222\blog2md 디렉터리에 넣은 후 다음 명령을 실행합니다.

node index.js w 111.xml out

 

2.5 이때 D:\222\blog2md\out 디렉터리가 생성되며, 생성된 콘텐츠를 입력한 후 올바른지 확인할 수 있습니다.

 

实验:将WordPress全站内容转换为AI助手的

 

实验:将WordPress全站内容转换为AI助手的

 

3.MD EXCEL 형식 변환

md 콘텐츠 그리드는 구조화되어 있어 추출하기 좋은데, 여기서는 chatgpt로 정규식을 작성하고 파이썬에서 실행합니다.

추출하려는 항목: 파일명(파일명은 URL, 예: https://aisharenet.com/anse/), 제목, 콘텐츠 영역(--- 아래 콘텐츠)

 

3.1 파이썬 스크립트를 실행하면 현재 디렉터리에 output.xlsx 파일이 생성됩니다.

实验:将WordPress全站内容转换为AI助手的

 

스크립트 콘텐츠:

스크립트 파일을 임의의 이름(111.py)으로 저장하고 임의의 디렉터리에 스크립트를 넣습니다(여기서는 D:\222\blog2md에 넣었습니다).

명령줄에서 실행합니다(기본 명령줄은 111.pt를 직접 실행할 수 없으므로 . \ 접두사를 추가해야 합니다)

.\111.py

 

스크립트 파일 코드는 다음과 같으며, 111.py(CHATGPT에서 생성)로 저장해 주세요.

md 파일을 읽을 디렉토리: 폴더 경로 = "D:\\222\\blog2md\\out"

현재 디렉터리에 EXCEL 생성: output_file = "output.xlsx"

import os
import pandas as pd
import re
import html
def clean_content(content):
# 移除 Markdown 语法中的特殊字符
content = re.sub(r'[*_~`#]', '', content)
# 将 HTML 实体转换为对应字符
content = html.unescape(content)
# 移除可能导致 Excel 问题的字符
content = ''.join(char for char in content if ord(char) < 65536)
# 替换换行符为空格
content = content.replace('\n', ' ').replace('\r', '')
# 移除多余的空格
content = re.sub(r'\s+', ' ', content).strip()
return content
def md_to_excel(folder_path, output_file):
data = []
for filename in os.listdir(folder_path):
if filename.endswith(".md"):
file_path = os.path.join(folder_path, filename)
try:
with open(file_path, "r", encoding="utf-8") as file:
content = file.read()
# 使用正则表达式提取元数据
metadata_pattern = r"---\n(.*?)\n---"
metadata_match = re.search(metadata_pattern, content, re.DOTALL)
if metadata_match:
metadata = metadata_match.group(1)
title = re.search(r"title:\s*['\"](.*?)['\"]", metadata)
title = title.group(1) if title else ""
# 提取内容部分
content_pattern = r"---\n.*?\n---\n\n(.*)"
content_match = re.search(content_pattern, content, re.DOTALL)
text_content = content_match.group(1) if content_match else ""
# 清理内容
cleaned_content = clean_content(text_content)
# 获取文件名(不包含.md后缀)作为URL
url = os.path.splitext(filename)[0]
data.append({
"title": title,
"content": cleaned_content,
"url": url
})
except Exception as e:
print(f"Error processing file {filename}: {str(e)}")
# 将数据转换为DataFrame并保存为Excel文件
df = pd.DataFrame(data)
try:
df.to_excel(output_file, index=False, engine='openpyxl')
print(f"Successfully saved to {output_file}")
except Exception as e:
print(f"Error saving Excel file: {str(e)}")
# 尝试使用 CSV 格式保存
csv_file = output_file.rsplit('.', 1)[0] + '.csv'
df.to_csv(csv_file, index=False, encoding='utf-8-sig')
print(f"Saved as CSV instead: {csv_file}")
# 指定Markdown文件所在的目录和输出的Excel文件路径
folder_path = "D:\\222\\blog2md\\out"
output_file = "output.xlsx"
# 调用函数进行转换
md_to_excel(folder_path, output_file)


3.2 업로드할 지식창고로 output.xlsx 데이터 수집하기

여기에서는 제목만 유지되고 전체 URL이 연결됩니다.

实验:将WordPress全站内容转换为AI助手的

 

4. 만심 스마트 바디에서 업로드한 지식 베이스

 

4.1 리터러시 마인드 지성체에 액세스하여 지식창고 업로드하기

实验:将WordPress全站内容转换为AI助手的

 

4.2 EXCEL 파일 업로드하기

实验:将WordPress全站内容转换为AI助手的

 

4.3 사용자 지정 검색 열 (이것이 Wenshin Intelligence를 사용하는 이유이며 다른 도구에는이 인터페이스가 없습니다.)

实验:将WordPress全站内容转换为AI助手的

 

지식창고 정리에 대한 자세한 팁은 다음을 참조하세요:문학적 마인드 지능 바디 튜토리얼: (4) 문서 처리 및 지식창고에 동기화하기

 

5. 인텔리전스를 만들고 사용할 수 있도록 게시합니다.

 

5.1 인텔리전스 만들기

여기서는 세부 사항에 얽매이지 않고 간단하게 구성해 보겠습니다. 인텔리전스 만들기 시작하기...

로우 코드 모드를 사용하여 지능형 바디를 만들고 여러 지식 기반 판단 논리를 추가하여 결국 사이트에는 많은 채널이 있습니다. 글쎄, 나는 여기서 시연하지 않을 것이며, 로우 코드 친구에 관심이있는 친구들이 읽을 수 있습니다:웬신 인텔리전트 바디 튜토리얼: (V) 인텔리전트 바디 워크플로 안무 구성하기

实验:将WordPress全站内容转换为AI助手的

 

5.2 인텔리전스 구성

이상 현상을 방지하기 위해 지식 기반이 아닌 기능은 끄고 다른 설정은 미세 조정하지 않고 기본값으로 두겠습니다.

实验:将WordPress全站内容转换为AI助手的

 

리콜된 지식창고의 적중률은 간단히 테스트해야 하며, 그렇지 않으면 관련 없는 콘텐츠가 쉽게 일치할 수 있습니다.

实验:将WordPress全站内容转换为AI助手的

 

5.3 디버깅 및 출력 미리보기

实验:将WordPress全站内容转换为AI助手的

 

5.4 출판 인텔리전스

实验:将WordPress全站内容转换为AI助手的

 

궁극

결국, 대중의 AI 도구를 빠르게 검색할 수 있는 지능형 바디를 무료로 얻을 수 있습니다! 한편, 웬신 스마트바디 유통 채널( 웬신 인텔리전트 바디 플랫폼: 완전한 유통 채널 및 상업적 폐쇄를 기반으로 구축된 인텔리전트 바디 애플리케이션 ), 이 도구는 사용자가 액세스할 수 있도록 Baidu 홈페이지에 공개됩니다.

© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...