我正在尝试使用 langchain 和 openAI 创建一个聊天机器人,它可以根据用户查询查询包含大量表的数据库。我使用了 SQLDatabaseSequentialChain,如果数据库中有大量表,据说这是最好的。
问题是当我运行此代码时,需要很长时间才能建立连接,最后我收到此错误:
raise self.handle_error_response(
openai.error.APIError: internal error {
"message": "internal error",
"type": "invalid_request_error",
"param": null,
"code": null
}
}
500 {'error': {'message': 'internal error', 'type': 'invalid_request_error', 'param': None, 'code': None}} {'Date': 'Wed, 21 Jun 2023 14:49:42 GMT', 'Content-Type':
'application/json; charset=utf-8', 'Content-Length': '147', 'Connection': 'keep-alive', 'vary': 'Origin', 'x-request-id': '37d9d00a37ce69e68166317740bad7da', 'strict-transport-security': 'max-age=15724800; includeSubDomains', 'CF-Cache-Status': 'DYNAMIC', 'Server': 'cloudflare', 'CF-RAY': '7dad0f24fa9c6ec5-BOM', 'alt-svc': 'h3=":443"; ma=86400'}
下面是我在网上找到的代码:
from langchain import OpenAI, SQLDatabase
from langchain.chains import SQLDatabaseSequentialChain
import pyodbc
server = 'XYZ'
database = 'XYZ'
username = 'XYZ'
password = 'XYZ'
driver = 'ODBC Driver 17 for SQL Server'
conn_str = f"mssql+pyodbc://{username}:{password}@{server}/{database}?driver={driver}"
try:
# Establish a connection to the database
conn = SQLDatabase.from_uri(conn_str)
except pyodbc.Error as e:
# Handle any errors that occur during the connection or query execution
print(f"Error connecting to Azure SQL Database: {str(e)}")
OPENAI_API_KEY = "XYZ key"
llm = OpenAI(temperature=0, openai_api_key=OPENAI_API_KEY, model_name='text-davinci-003 ')
PROMPT = """
Given an input question, first create a syntactically correct SQL query to run,
then look at the results of the query and return the answer.
The question: {question}
"""
db_chain = SQLDatabaseSequentialChain.from_llm(llm, conn, verbose=True, top_k=3)
question = "What is the property code of Ambassador, 821?"
db_chain.run(PROMPT.format(question=question))
我已确认我的 openAI API key 已启动并正在运行。
请帮我解决这个问题。
此外,如果您对我应该考虑的任何其他方法有建议,请告诉我。我目前正在对这个项目进行RnD,但没有找到任何令人满意的解决方案。
谢谢
我尝试检查我的 openAI API key 是否可用,是的,是的。预计会得到GPT模型的回应。
最佳答案
SQLDatabase 类在其 init 中有一个元数据反射(reflect)函数调用。无论您在“include_tables”中指定什么,它都会检查数据库中每个表的元数据。它不会将检查结果分配给任何东西。当我注释掉这些行时,代码现在运行时间为 <0.5 秒,而它花费的时间不止几分钟。
self._max_string_length = max_string_length
self._metadata = metadata or MetaData()
# including view support if view_support = true
# self._metadata.reflect(
# views=view_support,
# bind=self._engine,
# only=list(self._usable_tables),
# schema=self._schema,
# )
关于azure-sql-database - Langchain的SQLDatabaseSequentialChain来查询数据库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/76525263/