update for custom model, ollama

2025-03-20 12:44:53 +08:00 · 2025-03-20 12:44:53 +08:00 · 570e8d9564
commit 570e8d9564
parent 76ecca0da9
9 changed files with 155 additions and 115 deletions
--- a/src/core/llm/manager.ts
+++ b/src/core/llm/manager.ts
@ -49,15 +49,35 @@ class LLMManager implements LLMManagerInterface {
 	constructor(settings: InfioSettings) {
 		this.infioProvider = new InfioProvider(settings.infioProvider.apiKey)
-		this.openrouterProvider = new OpenAICompatibleProvider(settings.openrouterProvider.apiKey, OPENROUTER_BASE_URL)
+		this.openrouterProvider = new OpenAICompatibleProvider(
-		this.siliconflowProvider = new OpenAICompatibleProvider(settings.siliconflowProvider.apiKey, SILICONFLOW_BASE_URL)
+			settings.openrouterProvider.apiKey,
-		this.alibabaQwenProvider = new OpenAICompatibleProvider(settings.alibabaQwenProvider.apiKey, ALIBABA_QWEN_BASE_URL)
+			settings.openrouterProvider.baseUrl && settings.openrouterProvider.useCustomUrl ?
-		this.deepseekProvider = new OpenAICompatibleProvider(settings.deepseekProvider.apiKey, DEEPSEEK_BASE_URL)
+				settings.openrouterProvider.baseUrl
 				: OPENROUTER_BASE_URL
 		)
 		this.siliconflowProvider = new OpenAICompatibleProvider(
 			settings.siliconflowProvider.apiKey,
 			settings.siliconflowProvider.baseUrl && settings.siliconflowProvider.useCustomUrl ?
 				settings.siliconflowProvider.baseUrl
 				: SILICONFLOW_BASE_URL
 		)
 		this.alibabaQwenProvider = new OpenAICompatibleProvider(
 			settings.alibabaQwenProvider.apiKey,
 			settings.alibabaQwenProvider.baseUrl && settings.alibabaQwenProvider.useCustomUrl ?
 				settings.alibabaQwenProvider.baseUrl
 				: ALIBABA_QWEN_BASE_URL
 		)
 		this.deepseekProvider = new OpenAICompatibleProvider(
 			settings.deepseekProvider.apiKey,
 			settings.deepseekProvider.baseUrl && settings.deepseekProvider.useCustomUrl ?
 				settings.deepseekProvider.baseUrl
 				: DEEPSEEK_BASE_URL
 		)
 		this.openaiProvider = new OpenAIAuthenticatedProvider(settings.openaiProvider.apiKey)
 		this.anthropicProvider = new AnthropicProvider(settings.anthropicProvider.apiKey)
 		this.googleProvider = new GeminiProvider(settings.googleProvider.apiKey)
 		this.groqProvider = new GroqProvider(settings.groqProvider.apiKey)
-		this.ollamaProvider = new OllamaProvider(settings.groqProvider.baseUrl)
+		this.ollamaProvider = new OllamaProvider(settings.ollamaProvider.baseUrl)
 		this.openaiCompatibleProvider = new OpenAICompatibleProvider(settings.openaicompatibleProvider.apiKey, settings.openaicompatibleProvider.baseUrl)
 		this.isInfioEnabled = !!settings.infioProvider.apiKey
 	}
@ -125,6 +145,8 @@ class LLMManager implements LLMManagerInterface {
 					request,
 					options,
 				)
 			case ApiProvider.OpenAICompatible:
 				return await this.openaiCompatibleProvider.generateResponse(model, request, options)
 			default:
 				throw new Error(`Unsupported model provider: ${model.provider}`)
 		}
--- a/src/core/llm/ollama.ts
+++ b/src/core/llm/ollama.ts
@ -68,7 +68,7 @@ export class OllamaProvider implements BaseLLMProvider {
 		const client = new NoStainlessOpenAI({
 			baseURL: `${this.baseUrl}/v1`,
-			apiKey: '',
+			apiKey: 'ollama',
 			dangerouslyAllowBrowser: true,
 		})
 		return this.adapter.generateResponse(client, request, options)
@ -87,7 +87,7 @@ export class OllamaProvider implements BaseLLMProvider {
 		const client = new NoStainlessOpenAI({
 			baseURL: `${this.baseUrl}/v1`,
-			apiKey: '',
+			apiKey: 'ollama',
 			dangerouslyAllowBrowser: true,
 		})
 		return this.adapter.streamResponse(client, request, options)
--- a/src/core/rag/embedding.ts
+++ b/src/core/rag/embedding.ts
@ -159,10 +159,9 @@ export const getEmbeddingModel = (
 				dangerouslyAllowBrowser: true,
 				baseURL: `${settings.ollamaProvider.baseUrl}/v1`,
 			})
 			const modelInfo = GetEmbeddingModelInfo(settings.embeddingModelProvider, settings.embeddingModelId)
 			return {
 				id: settings.embeddingModelId,
-				dimension: modelInfo.dimensions,
+				dimension: 0,
 				getEmbedding: async (text: string) => {
 					if (!settings.ollamaProvider.baseUrl) {
 						throw new LLMBaseUrlNotSetException(
--- a/src/core/rag/rag-engine.ts
+++ b/src/core/rag/rag-engine.ts
@ -5,6 +5,7 @@ import { DBManager } from '../../database/database-manager'
 import { VectorManager } from '../../database/modules/vector/vector-manager'
 import { SelectVector } from '../../database/schema'
 import { EmbeddingModel } from '../../types/embedding'
 import { ApiProvider } from '../../types/llm/model'
 import { InfioSettings } from '../../types/settings'
 import { getEmbeddingModel } from './embedding'
@ -32,6 +33,12 @@ export class RAGEngine {
 		this.embeddingModel = getEmbeddingModel(settings)
 	}
 	async initializeDimension(): Promise<void> {
 		if (this.embeddingModel.dimension === 0 && this.settings.embeddingModelProvider === ApiProvider.Ollama) {
 			this.embeddingModel.dimension = (await this.embeddingModel.getEmbedding("hello world")).length
 		}
 	}
 	// TODO: Implement automatic vault re-indexing when settings are changed.
 	// Currently, users must manually re-index the vault.
 	async updateVaultIndex(
@ -41,6 +48,8 @@ export class RAGEngine {
 		if (!this.embeddingModel) {
 			throw new Error('Embedding model is not set')
 		}
 		await this.initializeDimension()
 		await this.vectorManager.updateVaultIndex(
 			this.embeddingModel,
 			{
@ -60,6 +69,12 @@ export class RAGEngine {
 	}
 	async updateFileIndex(file: TFile) {
 		if (!this.embeddingModel) {
 			throw new Error('Embedding model is not set')
 		}
 		await this.initializeDimension()
 		await this.vectorManager.UpdateFileVectorIndex(
 			this.embeddingModel,
 			this.settings.ragOptions.chunkSize,
@ -68,6 +83,12 @@ export class RAGEngine {
 	}
 	async deleteFileIndex(file: TFile) {
 		if (!this.embeddingModel) {
 			throw new Error('Embedding model is not set')
 		}
 		await this.initializeDimension()
 		await this.vectorManager.DeleteFileVectorIndex(
 			this.embeddingModel,
 			file,
@ -94,6 +115,8 @@ export class RAGEngine {
 			throw new Error('Embedding model is not set')
 		}
 		await this.initializeDimension()
 		if (!this.initialized) {
 			await this.updateVaultIndex({ reindexAll: false }, onQueryProgressChange)
 		}
@ -101,11 +124,6 @@ export class RAGEngine {
 		onQueryProgressChange?.({
 			type: 'querying',
 		})
 		console.log('query, ', {
 			minSimilarity: this.settings.ragOptions.minSimilarity,
 			limit: this.settings.ragOptions.limit,
 			scope,
 		})
 		const queryResult = await this.vectorManager.performSimilaritySearch(
 			queryEmbedding,
 			this.embeddingModel,
@ -115,7 +133,6 @@ export class RAGEngine {
 				scope,
 			},
 		)
 		console.log('queryResult', queryResult)
 		onQueryProgressChange?.({
 			type: 'querying-done',
 			queryResult,
--- a/src/settings/components/ModelProviderSettings.tsx
+++ b/src/settings/components/ModelProviderSettings.tsx
@ -141,6 +141,7 @@ const CustomProviderSettings: React.FC<CustomProviderSettingsProps> = ({ plugin,
 				onChange={updateProvider}
 			/>
 			<div className="infio-llm-setting-divider"></div>
 			{currProvider !== ApiProvider.Ollama && (
 				<TextComponent
 					name={currProvider + " api key:"}
 					placeholder="Enter your api key"
@ -148,6 +149,7 @@ const CustomProviderSettings: React.FC<CustomProviderSettingsProps> = ({ plugin,
 					onChange={updateProviderApiKey}
 					type="password"
 				/>
 			)}
 			<div className="infio-llm-setting-divider"></div>
 			<ToggleComponent
 				name="Use custom base url"
--- a/src/types/llm/model.ts
+++ b/src/types/llm/model.ts
@ -10,7 +10,6 @@ export enum ApiProvider {
 	Groq = "Groq",
 	Ollama = "Ollama",
 	OpenAICompatible = "OpenAICompatible",
 	TransformersJs = "TransformersJs",
 }
 export type LLMModel = {
--- a/src/types/settings.ts
+++ b/src/types/settings.ts
@ -125,14 +125,14 @@ const OpenAICompatibleProviderSchema = z.object({
 const OllamaProviderSchema = z.object({
 	name: z.literal('Ollama'),
-	apiKey: z.string().catch(''),
+	apiKey: z.string().catch('ollama'),
 	baseUrl: z.string().catch(''),
 	useCustomUrl: z.boolean().catch(false)
 }).catch({
 	name: 'Ollama',
-	apiKey: '',
+	apiKey: 'ollama',
 	baseUrl: '',
-	useCustomUrl: false
+	useCustomUrl: true
 })
 const GroqProviderSchema = z.object({
--- a/src/utils/api.ts
+++ b/src/utils/api.ts
@ -1141,7 +1141,9 @@ export const GetEmbeddingProviders = (): ApiProvider[] => {
 		ApiProvider.OpenAI,
 		ApiProvider.SiliconFlow,
 		ApiProvider.Google,
-		ApiProvider.AlibabaQwen
+		ApiProvider.AlibabaQwen,
 		ApiProvider.OpenAICompatible,
 		ApiProvider.Ollama,
 	]
 }
--- a/src/utils/web-search.ts
+++ b/src/utils/web-search.ts
@ -210,7 +210,6 @@ export async function webSearch(query: string, serperApiKey: string, jinaApiKey:
 	}
 }
 // todo: update 
 export async function fetchUrlsContent(urls: string[], apiKey: string): Promise<string> {
 	return new Promise((resolve) => {
 		const results = urls.map(async (url) => {