Ragas: evaluación de la memoria RAG Precisión de la GC y correlación de respuestas
Últimos recursos sobre IAPublicado hace 7 meses Círculo de intercambio de inteligencia artificial 1.7K 00
Introducción general
Ragas es una herramienta diseñada específicamente para evaluar y optimizar los sistemas de Generación Aumentada de Recuperación (RAG). Proporciona un amplio conjunto de métricas de evaluación mediante el análisis de la relación entre la consulta, el contexto de recuperación y las respuestas generadas. Estas métricas incluyen la fidelidad, la relevancia de la respuesta, la relevancia contextual, la recuperación contextual y la precisión contextual. Ragas ayuda a los desarrolladores a evaluar y optimizar el rendimiento de los sistemas RAG para garantizar que las respuestas generadas sean precisas, relevantes y se basen en el contenido recuperado. Tanto si está desarrollando un nuevo sistema como si está optimizando uno ya existente, Ragas le ofrece una potente ayuda.
Lista de funciones
- Evaluación de la fidelidadMide la fidelidad de la respuesta generada al contexto recuperado.
- Evaluación de la pertinencia de las respuestas: Evalúa la pertinencia de la respuesta generada con respecto a la consulta original.
- Evaluación de la pertinencia contextualMide hasta qué punto la información recuperada se ajusta al problema.
- Evaluación contextual del recuerdo: Evalúa si el contexto recuperado contiene toda la información necesaria para responder a la pregunta.
- Evaluación de la precisión contextual: Mide la calidad de la ordenación de los contextos relevantes recuperados en los resultados.
Utilizar la ayuda
Proceso de instalación
- Instalación a través de PyPI::
pip install ragas
- Instalación desde el origen::
pip install git+https://github.com/explodinggradients/ragas
Inicio rápido
- Importar los módulos necesarios::
from ragas import SingleTurnSample
from ragas.metrics import AspectCritic
- Preparación de los datos de prueba::
test_data = {
"user_input": "summarise given text\nThe company reported an 8% rise in Q3 2024, driven by strong performance in the Asian market. Sales in this region have significantly contributed to the overall growth. Analysts attribute this success to strategic marketing and product localization. The positive trend in the Asian market is expected to continue into the next quarter.",
"response": "The company experienced an 8% increase in Q3 2024, largely due to effective marketing strategies and product adaptation, with expectations of continued growth in the coming quarter."
}
- Evaluación del sistema GAR::
evaluator_llm = LangchainLLMWrapper(ChatOpenAI(model="gpt-4o"))
metric = AspectCritic(name="summary_accuracy", llm=evaluator_llm, definition="Verify if the summary is accurate.")
await metric.single_turn_ascore(SingleTurnSample(**test_data))
Flujo detallado de funcionamiento de las funciones
- Evaluación de la fidelidad::
- Utilizando las métricas de fidelidad proporcionadas por Ragas, se evalúa la fidelidad de las respuestas generadas al contexto recuperado.
- Los resultados de la evaluación de la fidelidad se obtienen y analizan llamando a las funciones de evaluación correspondientes.
- Evaluación de la pertinencia de las respuestas::
- Utilizando la métrica de relevancia de respuestas de Ragas, se evalúa el grado de relevancia de las respuestas generadas con respecto a la consulta original.
- Personalice la evaluación de la pertinencia de las respuestas generadas configurando los parámetros de evaluación de la pertinencia.
- Evaluación de la pertinencia contextual::
- Utilice la métrica de relevancia contextual de Ragas para medir hasta qué punto la información recuperada se ajusta al problema.
- Obtener el resultado de la evaluación de la relevancia del contexto llamando a la función de evaluación de la relevancia.
- Evaluación contextual del recuerdo::
- Utilice la métrica de recuperación de contexto de Ragas para evaluar si el contexto recuperado contiene toda la información necesaria para responder a la pregunta.
- Asegúrese de que el contexto recuperado cubre completamente la información requerida para la pregunta estableciendo los parámetros de evaluación de la recuperación.
- Evaluación de la precisión contextual::
- Utilice la métrica de precisión contextual de Ragas para medir la calidad de la ordenación de los contextos relevantes recuperados en los resultados.
- Optimice la clasificación de los resultados de la recuperación configurando los parámetros de evaluación de la precisión.
Ragas Evaluación QA Notas
Las retiradas de calidad suelen constar de dos componentes:
1. Recuperador - Recupera la información más relevante necesaria para responder a una consulta.
2. Generador - Utiliza la información recuperada para generar respuestas.
Evaluar la precisión de la garantía de calidad siempre ha sido un gran problema.ROUGE(Paquete de evaluación automática de resúmenesyAZUL(un método de evaluación automática de la traducción automática) es menos eficaz.
Metodología actual: evaluación sin referencias mediante un potente LLM, así que charle más detenidamente sobre Ragas.
Ragas está diseñado para hacer frente a estas limitaciones de la utilización de LLM para evaluar su canal de control de calidad, al tiempo que proporciona métricas procesables utilizando la menor cantidad posible de datos anotados, más rentables y más rápidos.
Ragas es un marco que le ayuda a evaluar estos diferentes aspectos de su canal de control de calidad. Te proporciona una serie de métricas para evaluar diferentes aspectos de tu sistema de control de calidad.

Indicadores utilizados para evaluar la recuperación: ofrece y le proporciona una medida del rendimiento del sistema de recuperación.
relevancia_contexto
llamada_contexto
Evaluación de los indicadores generados: Indique qué mide la ilusión y qué mide la forma de responder a la pregunta.
fidelidad
relevancia_de_la_respuesta
fidelidad
Mida la exactitud factual de las respuestas generadas en función del contexto proporcionado.
Esto se hace en dos pasos.
En primer lugar, dada una pregunta y generada una respuesta, Ragas utiliza LLM para averiguar las afirmaciones de la respuesta generada. Así se obtiene una lista de afirmaciones cuya validez debemos comprobar. En el paso 2, dada la lista de afirmaciones y el contexto devuelto, Ragas utiliza LLM para comprobar si las afirmaciones proporcionadas están respaldadas por el contexto. El número de afirmaciones correctas se suma y se divide por el número total de afirmaciones de la respuesta generada para obtener la puntuación del ejemplo dado.
Primer paso:
Según la primera indicación.
Given a question and answer, create one or more statements from answer.
question: Who was Albert Einstein and what is he best known for?
answer: He was a German-born theoretical physicist, widely acknowledged to be one of the greatest and most influential physicists of all time. He was best known for developing the theory of relativity, he also made important contributions to the development of the theory of quantum mechanics.
statements:
Albert Einstein was born in Germany.
Albert Einstein was best known for his theory of relativity.
question: Cadmium Chloride is slightly soluble in this chemical, it is also called what?
answer: alochol
statements:
Cadmium Chloride is slightly soluble in alcohol.
question: Were Shahul and Jithin of the same nationality?
answer: They were from different countries.
statements:
Shahul and Jithin were from different countries.
question:膳食分析是什么?
answer: 膳食分析是一种评估人们摄入的食物的方法,通过详细分析一周内所吃的食物,来确定人们摄入的营养素种类和数量。它可以揭示人们是否缺乏某些营养素,以及食物中是否存在一些对健康有害的物质,如糖、盐、咖啡因、酒精、食品添加剂和防腐剂。膳食分析可以提供关于脂肪、碳水化合物、蛋白质和热量的摄入量的评估。然而,膳食分析并不能全面考虑到食物中营养素含量的变异性、个人的营养素需求,以及营养素的吸收和利用情况。因此,它可能并不是评估个人的确切营养状况最准确的方法。
statements:
Obtener resultado 1:
['膳食分析是一种评估人们摄入的食物的方法。',
'膳食分析可以确定人们摄入的营养素种类和数量。',
'膳食分析可以揭示人们是否缺乏某些营养素。',
'膳食分析可以揭示食物中是否存在一些对健康有害的物质。',
'膳食分析可以提供关于脂肪、碳水化合物、蛋白质和热量的摄入量的评估。',
'膳食分析可能并不是评估个人的确切营养状况最准确的方法。']
Segundo paso:
De acuerdo con la segunda pregunta.
Prompt: Natural language inference
Consider the given context and following statements, then determine whether they are supported by the information present in the context.Provide a brief explanation for each statement before arriving at the verdict (Yes/No). Provide a final verdict for each statement in order at the end in the given format. Do not deviate from the specified format.
Context:
John is a student at XYZ University. He is pursuing a degree in Computer Science. He is enrolled in several courses this semester, including Data Structures, Algorithms, and Database Management. John is a diligent student and spends a significant amount of time studying and completing assignments. He often stays late in the library to work on his projects.
statements:
1. John is majoring in Biology.
2. John is taking a course on Artificial Intelligence.
3. John is a dedicated student.
4. John has a part-time job.
5. John is interested in computer programming.
Answer:
1. John is majoring in Biology.
Explanation: John's major is explicitly mentioned as Computer Science. There is no information suggesting he is majoring in Biology. Verdict: No.
2. John is taking a course on Artificial Intelligence.
Explanation: The context mentions the courses John is currently enrolled in, and Artificial Intelligence is not mentioned. Therefore, it cannot be deduced that John is taking a course on AI. Verdict: No.
3. John is a dedicated student.
Explanation: The prompt states that he spends a significant amount of time studying and completing assignments. Additionally, it mentions that he often stays late in the library to work on his projects, which implies dedication. Verdict: Yes.
4. John has a part-time job.
Explanation: There is no information given in the context about John having a part-time job. Therefore, it cannot be deduced that John has a part-time job. Verdict: No.
5. John is interested in computer programming.
Explanation: The context states that John is pursuing a degree in Computer Science, which implies an interest in computer programming. Verdict: Yes.
Final verdict for each statement in order: No. No. Yes. No. Yes.
context:
你想要达到什么样的健康程度?如果你想了解自己精神和身体的全部潜在能力,确定你的最佳营养需求是非常必要的。但是如果你的营养需求很特别,那么你该如何发现这一点呢?从1980年开始,我制定并完善了一套分析人体营养需求的体系,此体系建立在评估影响个人营养需求的主要因素的基础上。此体系已经在10万人当中进行了测试并得到了验证,现在已被世界各国的临床营养学家所应用。无数人已经从中获益,因此,我知道从这个体系中可以得到什么样的结果。这些结果包括:更敏锐的思维、更好的记忆力、更强的体力、更好的体重控制效果、降低胆固醇含量、使得病情好转。尽管多数被诊断为有病的人已经受益于个人健康计划,但这个健康计划是以预防为主要目标,而不是以治病为主的。如果你正在进行医药治疗,请确认这个营养补充方案与你接受的治疗措施是否能够很好地相容。影响你营养需求的因素,至少有8项因素会影响你的营养需求量。年龄、性别以及运动量都是很常见的影响因素,但污染、压力、基因遗传、你过去的健康状况,当然还有膳食所能提供的营养素以及反营养物质,却不是能够轻易了解的。但是所有的这些细节以及更多的因素,都必须纳入考虑当中。通过4种分析方法——膳食分析、生化分析、症状分析、生活方式分析,可以了解这些细节。膳食分析这种方式似乎是从容易着手的地方开始:搞清楚人们摄入的食物是什么,就能发现缺乏的营养素是什么。
但不幸的是,如果对一周内所吃的食物进行详细分析,并不能综合考虑到食物营养素含量的变异性、个人的营养素需求,或者营养素是否能被吸收、吸收后的营养素又是否能被有效地利用等情况。我见过许多人的饮食质量很高,却依然有维生素缺乏的症状。对其中绝大部分人来说,问题在于营养素吸收不良。这些可变因素,使得某些通过计算机进行的膳食分析不如设想的准确。膳食分析对于评估那些能影响到人们营养素需求的食物很有用处,比如糖、盐、咖啡、茶、酒精、食品添加剂和防腐剂。另一些因素,如脂肪、碳水化合物、蛋白质和热量的摄入量,也可由膳食分析进行评估。诸如头发矿物质分析与维生素血液分析这样的实验,可以提供关于体内生物化学状态的确切信息,也能让营养顾问了解你身体的确切营养状况。但并不是所有这些实验都能对规划你的营养方案提供有用的信息。为了让这些信息尽可能精确,任何关于维生素或矿物质的检测都必须反映出营养素在体内发挥作用的能力。例如,铁是构成血红细胞的必需元素,有助于体内氧的运输。通过测定细胞中铁的营养状况,可能会对你的铁需求有一个很好的估测。从另一方面来讲,维生素氏在血液中没有像铁那样的直接作用。它主要作用于大脑当中的化学物质5-羟色胺,或在甲基化反应中起作用,降低同型半胱氨酸含量。所以,仅仅测定血液中的维生素B6,并不能真实地反映你是否获得了充足的营养素供给以及体内的维生素B6是否运转正常。相比之下,检测同型半胱氨酸浓度等项目意义更大。如果你已经获得了充足的维生素、维生素B和叶酸,那么你的同型半胱氨酸浓度就很低,但假如同型半胱氨酸浓度很高,则表明你需要更多的其中一种或多种营养素。我们称这种测试方式为功能测试,因为这个测试能够精确地测定你体内生化反应的某项特殊功能是否运转正常。
statements:
1.膳食分析是一种评估人们摄入的食物的方法。
2.膳食分析可以确定人们摄入的营养素种类和数量。
3.膳食分析可以揭示人们是否缺乏某些营养素。
4.膳食分析可以揭示食物中是否存在一些对健康有害的物质。
5.膳食分析可以提供关于脂肪、碳水化合物、蛋白质和热量的摄入量的评估。
6.膳食分析可能并不是评估个人的确切营养状况最准确的方法。
Answer:
Obtener resultado 2:
1. 膳食分析是一种评估人们摄入的食物的方法.
explanation: the context mentions that dietary analysis is a method to understand what food people consume. verdict: yes.
2. 膳食分析可以确定人们摄入的营养素种类和数量.
explanation: the context mentions that dietary analysis can evaluate the intake of nutrients such as sugar, salt, coffee, tea, alcohol, food additives, and preservatives. it does not explicitly state that it can determine the types and quantities of nutrients consumed. verdict: no.
3. 膳食分析可以揭示人们是否缺乏某些营养素.
explanation: the context mentions that dietary analysis can be useful in assessing the intake of nutrients that can affect people's nutritional needs. this implies that it can reveal if someone is lacking certain nutrients. verdict: yes.
4. 膳食分析可以揭示食物中是否存在一些对健康有害的物质.
explanation: the context mentions that dietary analysis can be useful in evaluating the intake of substances that can affect people's nutritional needs, such as food additives and preservatives. this implies that it can reveal the presence of harmful substances in food. verdict: yes.
5. 膳食分析可以提供关于脂肪、碳水化合物、蛋白质和热量的摄入量的评估.
explanation: the context mentions that the intake of factors such as fat, carbohydrates, protein, and calories can be evaluated through dietary analysis. verdict: yes.
6. 膳食分析可能并不是评估个人的确切营养状况最准确的方法.
explanation: the context mentions that while dietary analysis can provide useful information, it may not be the most accurate method for assessing an individual's exact nutritional status. verdict: yes.
final verdict for each statement in order: yes. no. yes. yes. yes. yes.
fundaciónfinal verdict for each statement in order:
localizar enyes. no. yes. yes. yes. yes.
Contar puntos:
output = "yes. no. yes. yes. yes. yes."
score = sum(0 if "yes" in answer else 1
for answer in output.strip().split(".")
if answer != ""
)
# score = 1 - score/len(statements)
socre = 1 - 1/6
# score = 0.8333333333333334
Este es el resultado final de FAITHFULNESSD.
relevancia_de_la_respuesta
Mida la pertinencia y el enfoque de la respuesta a la pregunta.
Para una respuesta generada dada, Ragas utiliza LLM para encontrar las posibles preguntas para las que la respuesta generada será la respuesta y calcula la similitud con la pregunta real.
Según las respuestas.
Generate question for the given answer.
Answer:
The PSLV-C56 mission is scheduled to be launched on Sunday, 30 July 2023 at 06:30 IST / 01:00 UTC. It will be launched from the Satish Dhawan Space Centre, Sriharikota, Andhra Pradesh, India
Question: When is the scheduled launch date and time for the PSLV-C56 mission, and where will it be launched from?
Answer:膳食分析是一种评估个人饮食中摄入的食物种类和数量的方法。通过对一周内所吃的食物进行详细分析,可以了解人们摄入的营养素种类和含量,从而发现可能存在的营养素缺乏或过量的情况。膳食分析对于评估食物中的营养素含量、摄入量以及一些影响营养需求的因素(如糖、盐、咖啡因、酒精等)是有用的。然而,膳食分析并不能综合考虑到个体的营养素需求、营养素吸收和利用的情况,因此并不是评估个人营养状况的唯一方法。
Question:
Consíguelo:
[
"What is dietary analysis and how is it used to evaluate an individual's nutritional intake?",
"What is dietary analysis and how is it used to assess an individual's nutritional intake?",
"What is dietary analysis and how is it used to assess an individual's nutritional intake?"
]
A continuación, calcule la similitud entre [problema] y estos tres resultados:
Proceso de cálculo de la similitud: mediantetext-embedding-ada-002
Realice la vectorización y, a continuación, calcule la similitud del coseno.
def calculate_similarity(
self: t.Self, question: str, generated_questions: list[str]
):
question_vec = np.asarray(self.embedding.embed_query(question)).reshape(1, -1)
gen_question_vec = np.asarray(
self.embedding.embed_documents(generated_questions)
)
norm = np.linalg.norm(gen_question_vec, axis=1) * np.linalg.norm(
question_vec, axis=1)
return (
np.dot(gen_question_vec, question_vec.T).reshape(-1,)/ norm
)
Consíguelo:
[0.83663467 0.83484782 0.83484782]
Pues media:
answer_relevancy_score: 0.8354434364200779
relevancia_contexto
Medir la relación señal-ruido en el contexto recuperado. Dada una pregunta, Ragas llama a LLM para que encuentre la frase necesaria para responder a la pregunta a partir del contexto recuperado. La relación entre las frases necesarias y el total de frases del contexto le proporciona una puntuación.
Entrada:
Task: Candidate sentence extraction.
Given the question and context, extract minimum number of sentences from context required to answer the question. If the context do not contain information required to answer the question return "No candidate sentences found".
question: Which equation is known as worlds most famous equation?
context:
Albert Einstein (14 March 1879 – 18 April 1955) was a German-born theoretical physicist,[5] widely ranked among the greatest and most influential scientists of all time. Best known for developing the theory of relativity, he also made important contributions to quantum mechanics, and was thus a central figure in the revolutionary reshaping of the scientific understanding of nature that modern physics accomplished in the first decades of the twentieth century.
His mass–energy equivalence formula E = mc2, which arises from relativity theory, has been called "the world's most famous equation".
sentences:His mass–energy equivalence formula E = mc2, which arises from relativity theory, has been called "the world's most famous equation".
question: Were Scott Derrickson and Ed Wood of the same nationality?
context :
Scott Derrickson (born July 16, 1966) is an American director, screenwriter and producer He lives in Los Angeles, California He is best known for directing horror films such as "Sinister", "The Exorcism of Emily Rose", and "Deliver Us From Evil", as well as the 2016 Marvel Cinematic Universe installment, "Doctor Strange"Tyler Bates is an American musician, music producer, and composer for films, television, and video games. Adam Collis is an American filmmaker and actor.Conrad Brooks is an American actor.Edward Davis Wood Jr. (October 10, 1924 – December 10, 1978) was an American filmmaker, actor, writer, producer, and director.
sentences:Scott Derrickson (born July 16, 1966) is an American director, screenwriter and producer. Edward Davis Wood Jr. (October 10, 1924 – December 10, 1978) was an American filmmaker, actor, writer, producer, and director.
question: How many were killed in the Tiananmen Square incident?
context:
Tiananmen Square incident, also called June Fourth incident or 6/4, series of protests and demonstrations in China in the spring of 1989 that culminated on the night of June 3–4 with a government crackdown on the demonstrators in Tiananmen Square in Beijing.
sentences: No candidate sentences found.
question:膳食分析是什么?
context:
你想要达到什么样的健康程度?如果你想了解自己精神和身体的全部潜在能力,确定你的最佳营养需求是非常必要的。但是如果你的营养需求很特别,那么你该如何发现这一点呢?从1980年开始,我制定并完善了一套分析人体营养需求的体系,此体系建立在评估影响个人营养需求的主要因素的基础上。此体系已经在10万人当中进行了测试并得到了验证,现在已被世界各国的临床营养学家所应用。无数人已经从中获益,因此,我知道从这个体系中可以得到什么样的结果。这些结果包括:更敏锐的思维、更好的记忆力、更强的体力、更好的体重控制效果、降低胆固醇含量、使得病情好转。尽管多数被诊断为有病的人已经受益于个人健康计划,但这个健康计划是以预防为主要目标,而不是以治病为主的。如果你正在进行医药治疗,请确认这个营养补充方案与你接受的治疗措施是否能够很好地相容。影响你营养需求的因素,至少有8项因素会影响你的营养需求量。年龄、性别以及运动量都是很常见的影响因素,但污染、压力、基因遗传、你过去的健康状况,当然还有膳食所能提供的营养素以及反营养物质,却不是能够轻易了解的。但是所有的这些细节以及更多的因素,都必须纳入考虑当中。通过4种分析方法——膳食分析、生化分析、症状分析、生活方式分析,可以了解这些细节。膳食分析这种方式似乎是从容易着手的地方开始:搞清楚人们摄入的食物是什么,就能发现缺乏的营养素是什么。
但不幸的是,如果对一周内所吃的食物进行详细分析,并不能综合考虑到食物营养素含量的变异性、个人的营养素需求,或者营养素是否能被吸收、吸收后的营养素又是否能被有效地利用等情况。我见过许多人的饮食质量很高,却依然有维生素缺乏的症状。对其中绝大部分人来说,问题在于营养素吸收不良。这些可变因素,使得某些通过计算机进行的膳食分析不如设想的准确。膳食分析对于评估那些能影响到人们营养素需求的食物很有用处,比如糖、盐、咖啡、茶、酒精、食品添加剂和防腐剂。另一些因素,如脂肪、碳水化合物、蛋白质和热量的摄入量,也可由膳食分析进行评估。诸如头发矿物质分析与维生素血液分析这样的实验,可以提供关于体内生物化学状态的确切信息,也能让营养顾问了解你身体的确切营养状况。但并不是所有这些实验都能对规划你的营养方案提供有用的信息。为了让这些信息尽可能精确,任何关于维生素或矿物质的检测都必须反映出营养素在体内发挥作用的能力。例如,铁是构成血红细胞的必需元素,有助于体内氧的运输。通过测定细胞中铁的营养状况,可能会对你的铁需求有一个很好的估测。从另一方面来讲,维生素氏在血液中没有像铁那样的直接作用。它主要作用于大脑当中的化学物质5-羟色胺,或在甲基化反应中起作用,降低同型半胱氨酸含量。所以,仅仅测定血液中的维生素B6,并不能真实地反映你是否获得了充足的营养素供给以及体内的维生素B6是否运转正常。相比之下,检测同型半胱氨酸浓度等项目意义更大。如果你已经获得了充足的维生素、维生素B和叶酸,那么你的同型半胱氨酸浓度就很低,但假如同型半胱氨酸浓度很高,则表明你需要更多的其中一种或多种营养素。我们称这种测试方式为功能测试,因为这个测试能够精确地测定你体内生化反应的某项特殊功能是否运转正常。
sentences:
Consíguelo:
[
'膳食分析这种方式似乎是从容易着手的地方开始:搞清楚人们摄入的食物是什么,就能发现缺乏的营养素是什么。',
'膳食分析是从容易着手的地方开始:搞清楚人们摄入的食物是什么,就能发现缺乏的营养素是什么。'
]
Divida cada resultado, búsquelo en su contexto y vea qué porcentaje de las cláusulas divididas en cada resultado aparecen en el texto original overlap_scores.
Suponiendo que obtengamos[1.0, 1.0]
.
Contexto:
你想要达到什么样的健康程度?如果你想了解自己精神和身体的全部潜在能力,确定你的最佳营养需求是非常必要的。但是如果你的营养需求很特别,那么你该如何发现这一点呢?从1980年开始,我制定并完善了一套分析人体营养需求的体系,此体系建立在评估影响个人营养需求的主要因素的基础上。此体系已经在10万人当中进行了测试并得到了验证,现在已被世界各国的临床营养学家所应用。无数人已经从中获益,因此,我知道从这个体系中可以得到什么样的结果。这些结果包括:更敏锐的思维、更好的记忆力、更强的体力、更好的体重控制效果、降低胆固醇含量、使得病情好转。尽管多数被诊断为有病的人已经受益于个人健康计划,但这个健康计划是以预防为主要目标,而不是以治病为主的。如果你正在进行医药治疗,请确认这个营养补充方案与你接受的治疗措施是否能够很好地相容。影响你营养需求的因素,至少有8项因素会影响你的营养需求量。年龄、性别以及运动量都是很常见的影响因素,但污染、压力、基因遗传、你过去的健康状况,当然还有膳食所能提供的营养素以及反营养物质,却不是能够轻易了解的。但是所有的这些细节以及更多的因素,都必须纳入考虑当中。通过4种分析方法——膳食分析、生化分析、症状分析、生活方式分析,可以了解这些细节。膳食分析这种方式似乎是从容易着手的地方开始:搞清楚人们摄入的食物是什么,就能发现缺乏的营养素是什么。
但不幸的是,如果对一周内所吃的食物进行详细分析,并不能综合考虑到食物营养素含量的变异性、个人的营养素需求,或者营养素是否能被吸收、吸收后的营养素又是否能被有效地利用等情况。我见过许多人的饮食质量很高,却依然有维生素缺乏的症状。对其中绝大部分人来说,问题在于营养素吸收不良。这些可变因素,使得某些通过计算机进行的膳食分析不如设想的准确。膳食分析对于评估那些能影响到人们营养素需求的食物很有用处,比如糖、盐、咖啡、茶、酒精、食品添加剂和防腐剂。另一些因素,如脂肪、碳水化合物、蛋白质和热量的摄入量,也可由膳食分析进行评估。诸如头发矿物质分析与维生素血液分析这样的实验,可以提供关于体内生物化学状态的确切信息,也能让营养顾问了解你身体的确切营养状况。但并不是所有这些实验都能对规划你的营养方案提供有用的信息。为了让这些信息尽可能精确,任何关于维生素或矿物质的检测都必须反映出营养素在体内发挥作用的能力。例如,铁是构成血红细胞的必需元素,有助于体内氧的运输。通过测定细胞中铁的营养状况,可能会对你的铁需求有一个很好的估测。从另一方面来讲,维生素氏在血液中没有像铁那样的直接作用。它主要作用于大脑当中的化学物质5-羟色胺,或在甲基化反应中起作用,降低同型半胱氨酸含量。所以,仅仅测定血液中的维生素B6,并不能真实地反映你是否获得了充足的营养素供给以及体内的维生素B6是否运转正常。相比之下,检测同型半胱氨酸浓度等项目意义更大。如果你已经获得了充足的维生素、维生素B和叶酸,那么你的同型半胱氨酸浓度就很低,但假如同型半胱氨酸浓度很高,则表明你需要更多的其中一种或多种营养素。我们称这种测试方式为功能测试,因为这个测试能够精确地测定你体内生化反应的某项特殊功能是否运转正常。
A continuación, se calcula la similitud de las dos respuestas mediante bert o jaccard para obtener agr_score.
A continuación, se puede calcular context_relevancy:
context_relevancy = agr_score * (overlap_scores的平均值)
llamada_contexto
Antes de que pueda probar esto, necesita proporcionar unverdad_subyacente.
Siga las instrucciones:
Given a context, and an answer, analyze each sentence in the answer and classify if the sentence can be attributed to the given context or not.
Think in steps and reason bofore coming to conclusion.
context: Albert Einstein (14 March 1879 – 18 April 1955) was a German-born theoretical physicist,widely held to be one of the greatest and most influential scientists of all time. Best known for developing the theory of relativity, he also made important contributions to quantum mechanics, and was thus a central figure in the revolutionary reshaping of the scientific understanding of nature that modern physics accomplished in the first decades of the twentieth century. His mass–energy equivalence formula E = mc2, which arises from relativity theory, has been called "the world's most famous equation". He received the 1921 Nobel Prize in Physics "for his services to theoretical physics, and especially for his discovery of the law of the photoelectric effect", a pivotal step in the development of quantum theory. His work is also known for its influence on the philosophy of science. In a 1999 poll of 130 leading physicists worldwide by the British journal Physics World, Einstein was ranked the greatest physicist of all time. His intellectual achievements and originality have made Einstein synonymous with genius.
answer: Albert Einstein born in 14 March 1879 was German-born theoretical physicist, widely held to be one of the greatest and most influential scientists of all time. He received the 1921 Nobel Prize in Physics "for his services to theoretical physics. He published 4 papers in 1905. Einstein moved to Switzerland in 1895
classification
1. Albert Einstein born in 14 March 1879 was German-born theoretical physicist, widely held to be one of the greatest and most influential scientists of all time. The date of birth of Einstein is mentioned clearly in the context. So [Attributed]
2. He received the 1921 Nobel Prize in Physics "for his services to theoretical physics. The exact sentence is present in the given context. So [Attributed]
3. He published 4 papers in 1905. There is no mention about papers he wrote in given the context. So [Not Attributed]
4. Einstein moved to Switzerland in 1895. There is not supporting evidence for this in the given the context. So [Not Attributed]
context:{context}
answer:{ground_truth}
classification:
Obtención de resultados:
[
'#############[Attributed]',
'#############[Attributed]',
'#############[Not Attributed]',
……
]
Calcular el porcentaje de ocurrencias [Atribuidas] que son context_recall.
Opinión personal:
Acerca de esta biblioteca: no admite el acceso auzre a openai, es necesario cambiar el código fuente
Sobre los cuatro indicadores
context_relevancy: dudoso (incertidumbre sobre la eficacia del modelo stsb-TinyBERT-L-4 chino para calcular la similitud en agr_score)
context_recall: no está seguro de qué escenario utilizar ......
Fidelidad.
answer_relevancy: probablemente fiable (depende detext-embedding-ada-002
(Precisión de la semántica tras la vectorización)
© declaración de copyright
El artículo está protegido por derechos de autor y no debe reproducirse sin autorización.
Artículos relacionados
Sin comentarios...