In [8]:
## 准备部分
# 指定Embed对象
embed_object = "labors-law"
# 指定用户问题
query_text = "对于劳动合同的解除有什么规定?"

In [None]:
# 导入必要的包
import time
import os
import sys
import json
from chromadb import Client

# 获取当前脚本的目录
current_dir = os.getcwd()

# 读取设定文件
config_file_path = os.path.join(current_dir, "..", "setup", "config_embed.json")

# 读取配置项目
try:
    with open(config_file_path, "r", encoding="utf-8") as f:
        dict_config = json.load(f)
    # 读取通用项目
    API_URL = dict_config["API_URL"]
    cohere_access_token = dict_config["cohere_access_token"]
    custom_proxies = dict_config["custom_proxies"]
    list_chroma_dir = dict_config["list_chroma_dir"]
    list_embed_file_path = dict_config["list_embed_file_path"]
    # 读取Embed对象项目
    model_name = dict_config["docs"][embed_object]["model_name"]
    embed_file_name = dict_config["docs"][embed_object]["file_name"]
    split_chunk_size = dict_config["docs"][embed_object]["split_chunk_size"]
    split_overlap = dict_config["docs"][embed_object]["split_overlap"]
    model_batch_size = dict_config["docs"][embed_object]["model_batch_size"]
    collection_ids_prefix = dict_config["docs"][embed_object]["collection_ids_prefix"]
    embed_collection_name = dict_config["docs"][embed_object]["collection_name"]
except Exception as e:
    print("配置文件读取失败", e)
    sys.exit("Stop processing")

# 回退到上级目录并构建相对路径
chroma_dir = os.path.join(current_dir, *list_chroma_dir)
embed_file_path = os.path.join(current_dir, *list_embed_file_path, embed_file_name)

In [10]:
import chromadb

# 初始化 Chroma 客户端，指定之前的数据存储目录
client = chromadb.PersistentClient(path=chroma_dir)

# 获取 "document_embeddings" 集合
collection = client.get_collection(embed_collection_name)

In [11]:
# 装载本地的Hugging Face模型
from sentence_transformers import SentenceTransformer

model = SentenceTransformer("jinaai/jina-embeddings-v3", trust_remote_code=True)

In [12]:
# 查询文本
# query_embedding = get_embeddings([query_text])  # 使用之前的 get_embedding 函数生成嵌入
query_embedding = model.encode([query_text])

In [13]:
# 查询集合，返回前5个匹配的文档
results = collection.query(
    # query_embeddings=query_embedding["embeddings"],
    query_embeddings=query_embedding,
    n_results=5
)

# 显示查询结果
for doc, metadata in zip(results['documents'], results['metadatas']):
    print("Document:", doc)
    print("Metadata:", metadata)

Document: ['一的，劳动者可以随时通知用人单位解除劳动合同：（一）在试用期内的；（二）用人单位以暴力、威胁或者非法限制人身自由的手段强迫劳动的；（三）用人单位未按照劳动合同约定支付劳动报酬或者提供劳动条件的。第三十三条\u3000企业职工一方与企业可以就劳动报酬、工作时间、休息休假、劳动安全卫生、保险福利等事项，签订集体合同。集体合同草案应当提交职工代表大会或者全体职工讨论通过。集体合同由工会代表职工与企业签订；没有建立', '止条件出现，劳动合同即行终止。第二十四条\u3000经劳动合同当事人协商一致，劳动合同可以解除。第二十五条\u3000劳动者有下列情形之一的，用人单位可以解除劳动合同：（一）在试用期间被证明不符合录用条件的；（二）严重违反劳动纪律或者用人单位规章制度的；（三）严重失职，营私舞弊，对用人单位利益造成重大损害的；（四）被依法追究刑事责任的。第二十六条\u3000有下列情形之一的，用人单位可以解除劳动合同，但是应当提前三十日以书面形', '在孕期、产期、哺乳期内的；（四）法律、行政法规规定的其他情形。第三十条\u3000用人单位解除劳动合同，工会认为不适当的，有权提出意见。如果用人单位违反法律、法规或者劳动合同，工会有权要求重新处理；劳动者申请仲裁或者提起诉讼的，工会应当依法给予支持和帮助。第三十一条\u3000劳动者解除劳动合同，应当提前三十日以书面形式通知用人单位。第三十二条\u3000有下列情形之一的，劳动者可以随时通知用人单位解除劳动合同：（一）在试用期', '之一的，用人单位可以解除劳动合同，但是应当提前三十日以书面形式通知劳动者本人：（一）劳动者患病或者非因工负伤，医疗期满后，不能从事原工作也不能从事由用人单位另行安排的工作的；（二）劳动者不能胜任工作，经过培训或者调整工作岗位，仍不能胜任工作的；（三）劳动合同订立时所依据的客观情况发生重大变化，致使原劳动合同无法履行，经当事人协商不能就变更劳动合同达成协议的。第二十七条\u3000用人单位濒临破产进行法定整顿', '动保护和劳动条件；（四）劳动报酬；（五）劳动纪律；（六）劳动合同终止的条件；（七）违反劳动合同的责任。劳动合同除前款规定的必备条款外，当事人可以协商约定其他内容。第二十条\u3000劳动合同的期限分为有固定期限、无固定期限和以完成一定的工作为期限。11/22/24

In [14]:
import json
print(json.dumps(results["documents"], indent=4, ensure_ascii=False))

[
    [
        "一的，劳动者可以随时通知用人单位解除劳动合同：（一）在试用期内的；（二）用人单位以暴力、威胁或者非法限制人身自由的手段强迫劳动的；（三）用人单位未按照劳动合同约定支付劳动报酬或者提供劳动条件的。第三十三条　企业职工一方与企业可以就劳动报酬、工作时间、休息休假、劳动安全卫生、保险福利等事项，签订集体合同。集体合同草案应当提交职工代表大会或者全体职工讨论通过。集体合同由工会代表职工与企业签订；没有建立",
        "止条件出现，劳动合同即行终止。第二十四条　经劳动合同当事人协商一致，劳动合同可以解除。第二十五条　劳动者有下列情形之一的，用人单位可以解除劳动合同：（一）在试用期间被证明不符合录用条件的；（二）严重违反劳动纪律或者用人单位规章制度的；（三）严重失职，营私舞弊，对用人单位利益造成重大损害的；（四）被依法追究刑事责任的。第二十六条　有下列情形之一的，用人单位可以解除劳动合同，但是应当提前三十日以书面形",
        "在孕期、产期、哺乳期内的；（四）法律、行政法规规定的其他情形。第三十条　用人单位解除劳动合同，工会认为不适当的，有权提出意见。如果用人单位违反法律、法规或者劳动合同，工会有权要求重新处理；劳动者申请仲裁或者提起诉讼的，工会应当依法给予支持和帮助。第三十一条　劳动者解除劳动合同，应当提前三十日以书面形式通知用人单位。第三十二条　有下列情形之一的，劳动者可以随时通知用人单位解除劳动合同：（一）在试用期",
        "之一的，用人单位可以解除劳动合同，但是应当提前三十日以书面形式通知劳动者本人：（一）劳动者患病或者非因工负伤，医疗期满后，不能从事原工作也不能从事由用人单位另行安排的工作的；（二）劳动者不能胜任工作，经过培训或者调整工作岗位，仍不能胜任工作的；（三）劳动合同订立时所依据的客观情况发生重大变化，致使原劳动合同无法履行，经当事人协商不能就变更劳动合同达成协议的。第二十七条　用人单位濒临破产进行法定整顿",
        "动保护和劳动条件；（四）劳动报酬；（五）劳动纪律；（六）劳动合同终止的条件；（七）违反劳动合同的责任。劳动合同除前款规定的必备条款外，当事人可以协商约定其他内容。第二十条　劳动合同的期限分为有固定期限、无固定期限和以完成一定的工作为期限。11/22/24,"
    ]

In [15]:
# 释放内存
del model
import gc
gc.collect()

28863