コンテンツにスキップ

Buckets

Show:

**バケット(bucket)**は、Schiftの公開ナレッジ保存領域です。バケットを使用すると、ドキュメントをアップロードし、インデックスの準備状況を確認し、引用付きの回答用コンテキストを検索し、ナレッジベースに属するドキュメントを管理できます。

注: すべてのバケットエンドポイントには、Authorization: Bearer <SCHIFT_API_KEY>ヘッダーが必要です。バケットやドキュメントを作成・変更・削除するエンドポイントには、buckets:manageスコープが必要です。読み取りおよび検索エンドポイントは、組織の制限内で有効なAPIキーを受け入れます。

公開製品APIはv2です。新規統合では、以下に記載されている/v2/buckets/*ルートを使用してください。

古い/v1/buckets/*ルートは、既存のクライアント向けの非推奨互換性サーフェスです。引き続き動作しますが、v1検索エンドポイントはDeprecationおよびLinkの後続バージョンヘッダーを返し、v2の相当するエンドポイントを示します。パブリックバケットは、両方のバージョンで読み取り専用です。

FieldTypeDescription
idstring一意のバケット識別子。
namestring人間が読めるバケット名。
descriptionstringオプションの説明。
dimensionintegerバケットに設定された埋め込み次元。
modelstringバケットに使用される埋め込みモデル。
backendstringベクトルバックエンド。例:engine
file_countintegerアップロードされたドキュメント数。
vector_countintegerインデックスされたベクトル数。
active_job_countintegerこのバケットの進行中のジョブ数。
created_atstringISO 8601作成タイムスタンプ。
default_privacy_levelintegerバケットコンテンツのデフォルトプライバシーレベル。
max_privacy_levelinteger許可される最大プライバシーレベル。
external_max_privacy_levelinteger外部に公開される最大プライバシーレベル。
enforce_access_policybooleanアクセスポリシーが強制されるかどうか。
scope_by_departmentboolean部署メタデータによってアクセスが制限されるかどうか。

新しいバケットを作成します。Schiftは、埋め込みモデル、次元、バックエンドを自動的に構成します。

FieldTypeRequiredDefaultDescription
namestringYesバケット名。__schift_で始まってはいけません。
descriptionstringNo""オプションの説明。
metadataobjectNonull自由形式のユーザーメタデータ。
default_privacy_levelintegerNo3デフォルトのプライバシーレベル。
max_privacy_levelintegerNo10最大プライバシーレベル。
external_max_privacy_levelintegerNo1外部プライバシー上限。
enforce_access_policybooleanNotrueアクセスポリシーの強制を有効にします。
scope_by_departmentbooleanNofalse部署別のアクセス範囲を適用します。
{
"name": "product-docs",
"description": "Product support knowledge"
}
{
"id": "bucket_01J8X1234567890ABCDEF",
"name": "product-docs",
"description": "Product support knowledge",
"dimension": 1024,
"model": "text-embedding-3-large",
"backend": "engine",
"file_count": 0,
"vector_count": 0,
"active_job_count": 0,
"created_at": "2026-06-19T05:00:00Z",
"default_privacy_level": 3,
"max_privacy_level": 10,
"external_max_privacy_level": 1,
"enforce_access_policy": false,
"scope_by_department": false
}
StatusCause
400無効なリクエストボディ。
403バケット名が予約された__schift_名前空間を使用しています。
409同じ名前のバケットが既に存在します。

認証された組織のバケットを一覧表示します。

[
{
"id": "bucket_01J8X1234567890ABCDEF",
"name": "product-docs",
"description": "Product support knowledge",
"dimension": 1024,
"model": "text-embedding-3-large",
"backend": "engine",
"file_count": 12,
"vector_count": 128,
"active_job_count": 0,
"created_at": "2026-06-19T05:00:00Z",
"default_privacy_level": 3,
"max_privacy_level": 10,
"external_max_privacy_level": 1,
"enforce_access_policy": false,
"scope_by_department": false
}
]

IDで単一のバケットを取得します。

ParameterTypeRequiredDescription
bucket_idstringYesバケット識別子。

POST /v2/bucketsの応答と同じ形式です。

StatusCause
404バケットが見つからないか、アクセスできません。

変更可能なバケットフィールドを変更します。現在、名前の変更、説明の更新、およびプライバシーポリシーフィールドを含むメタデータの更新をサポートしています。

ParameterTypeRequiredDescription
bucket_idstringYesバケット識別子。

すべてのフィールドはオプションです。

FieldTypeDescription
namestring新しいバケット名。
descriptionstring新しい説明。
metadataobject既存のメタデータにマージされる自由形式のメタデータ。
default_privacy_levelintegerデフォルトのプライバシーレベル。
max_privacy_levelinteger最大プライバシーレベル。
external_max_privacy_levelinteger外部プライバシー上限。
enforce_access_policybooleanアクセスポリシーの強制を有効にします。
scope_by_departmentboolean部署別のアクセス範囲を適用します。
{
"description": "Updated product support knowledge"
}

POST /v2/bucketsの応答と同じ形式です。

StatusCause
403パブリックバケットは読み取り専用です。
404バケットが見つかりません。
409新しいバケット名は既に使用されています。

バケットの削除をキューに入れます。削除は非同期に実行され、ジョブIDを返します。

ParameterTypeRequiredDescription
bucket_idstringYesバケット識別子。
{
"bucket_id": "bucket_01J8X1234567890ABCDEF",
"job_id": "job_01J8Y1234567890ABCDEF",
"status": "queued",
"delete_requested_at": "2026-06-19T05:05:00Z"
}
StatusCause
403パブリックバケットは読み取り専用です。
404バケットが見つかりません。

バケット内の子コレクションを一覧表示します。

ParameterTypeRequiredDescription
bucket_idstringYesバケット識別子。
[
{
"id": "col_01J8X1234567890ABCDEF",
"bucket_id": "bucket_01J8X1234567890ABCDEF",
"name": "migration-guides",
"description": "",
"dimension": 1024,
"model": "text-embedding-3-large",
"backend": "engine",
"file_count": 4,
"vector_count": 42,
"active_job_count": 0
}
]
StatusCause
404バケットが見つかりません。

バケットが質問に回答できる準備ができているかどうかを確認します。このエンドポイントは、検索を実行せずに、消費者向けの準備状況サマリーを返します。

ParameterTypeRequiredDescription
bucket_idstringYesバケット識別子。
{
"status": "ready",
"operational_status": "ready",
"bucket_id": "product-docs",
"indexed_count": 128,
"document_count": 12,
"pending_job_count": 0,
"failed_job_count": 0,
"last_indexed_at": "2026-06-19T04:55:00Z",
"backfill_required": false
}
StatusCause
404バケットが見つかりません。

管理されたナレッジ検索パイプラインを実行し、引用付きの回答用コンテキストを返します。呼び出し元は、埋め込みルート、ベクトルモード、またはリランク機構を選択する必要はありません。

ParameterTypeRequiredDescription
bucket_idstringYesバケット識別子。
FieldTypeRequiredDefaultDescription
querystringYesバケットに対して尋ねる質問。
top_kintegerNo8返す最大引用パッセージ数。範囲は1100
context_budgetintegerNo2000おおよその最大コンテキストサイズ(トークン数)。範囲は10032000
filtersobjectNonullメタデータフィルタ。詳細はFiltersを参照。
options.rerank.enabledbooleanNotrueコンテキスト組み立て前に引用の順序を改善します。
options.rerank.top_kintegerNonullリランクする候補パッセージ数。範囲は11000
options.instructions.taskstringNonullretrieval_queryなどの検索指示プリセット。
{
"query": "How do I migrate embedding models?",
"top_k": 8,
"context_budget": 4000,
"filters": {"product": "schift"},
"options": {
"rerank": {"enabled": true, "top_k": 20},
"instructions": {"task": "retrieval_query"}
}
}
{
"status": "ready",
"operational_status": "ready",
"bucket_id": "product-docs",
"query": "How do I migrate embedding models?",
"context": "[1] Migration guide excerpt...",
"citations": [
{
"index": 1,
"document_id": "doc_042",
"source_id": "doc_042",
"title": "Migration Guide",
"source_url": null,
"page": null,
"section": null
}
],
"warnings": []
}
StatusCause
400無効なフィルタまたはリクエストボディ。
402検索クォータを超過しました。
403検索クォータが利用できないか、プランの制限です。
404バケットが見つかりません。

POST /v2/buckets/{bucket_id}/collections/{collection_id}/search

Section titled “POST /v2/buckets/{bucket_id}/collections/{collection_id}/search”

生のv2検索コントラクトを使用して、バケット内の単一のコレクションを検索します。これは、バケット全体ではなく特定の子コレクションから結果を取得したい場合に便利です。

ParameterTypeRequiredDescription
bucket_idstringYesバケット識別子。
collection_idstringYesコレクション識別子。
FieldTypeRequiredDefaultDescription
querystringYes*""テキストクエリ。queryまたはqueryVectorのいずれかが必要です。
queryVectornumber[]Yes*null生の埋め込みベクトル。
topKintegerNo10最大結果数。範囲は11000
modelstringNonull埋め込みモデルのオーバーライド。
filterobjectNonullメタデータフィルタ。
accessModestringNoautoautointernalexternalのいずれか。rawは内部専用です。
modestringNohybridvectorまたはhybrid
rerankbooleanNofalseリランクを有効にします。
rerankTopKintegerNonullリランク用の候補数。
minScorenumberNonull最小結果スコア。範囲は01
debugbooleanNofalseデバッグタイミングとスコアを含めます。
{
"bucket_id": "product-docs",
"query": "migration",
"search_id": "search_01J8X1234567890ABCDEF",
"results": [
{
"id": "chunk_042",
"score": 0.923,
"text": "Migration guide excerpt...",
"metadata": {"document_id": "doc_042"},
"citation": null
}
],
"degraded": false,
"warnings": []
}
StatusCause
400queryまたはqueryVectorが欠落しているか、無効な時系列パラメータです。
403raw取得モードは内部専用です。
404バケットまたはコレクションが見つかりません。

1つ以上のファイルをバケットにアップロードします。アップロードされたファイルは、非同期に抽出、チャンク化、埋め込み、インデックス化されます。このエンドポイントはmultipart/form-dataを受け入れます。

ParameterTypeRequiredDescription
bucket_idstringYesバケット識別子。
FieldTypeRequiredDefaultDescription
filesfileYes1つ以上のファイル。PDF、Markdown、テキスト、Officeドキュメント、画像がサポートされています。
ocr_strategystringNoauto画像ベースのドキュメントに対するOCR戦略。
chunk_sizeintegerNo512目標チャンクサイズ。範囲は648192
chunk_overlapintegerNo50チャンクのオーバーラップ。範囲は0512
metadatastringNonullアップロードされた各ファイルに添付されるJSON文字列化されたオブジェクト。
collection_idstringNonull対象の子コレクション。デフォルトはバケットです。
Terminal window
curl -X POST ${API_BASE_URL}/v2/buckets/product-docs/documents \
-H "Authorization: Bearer $SCHIFT_API_KEY" \
-F "ocr_strategy=auto" \
-F "chunk_size=512" \
-F 'metadata={"source":"support","product":"schift"}'
{
"jobs": [
{
"job_id": "job_01J8X1234567890ABCDEF",
"document_id": "doc_01J8X1234567890ABCDEF",
"file_name": "manual.pdf",
"file_type": "pdf",
"status": "queued",
"estimated_cost": 0.05
}
],
"total_estimated_cost": 0.05
}
StatusCause
400サポートされていないファイルタイプまたは無効なフォームデータ。
403APIキーにbuckets:manageスコープがありません。
404バケットが見つかりません。
413ファイルまたはリクエストがアップロード制限を超えています。

バケット内のドキュメントを一覧表示します。

ParameterTypeRequiredDescription
bucket_idstringYesバケット識別子。
ParameterTypeRequiredDefaultDescription
statusstringNoドキュメントのステータスでフィルタリング。
limitintegerNo50最大結果数。範囲は1500
[
{
"id": "doc_01J8X1234567890ABCDEF",
"bucket_id": "product-docs",
"collection_id": null,
"file_name": "manual.pdf",
"file_type": "pdf",
"status": "ready",
"metadata": {"source": "support", "product": "schift"},
"source_metadata": {},
"latest_job_id": "job_01J8X1234567890ABCDEF",
"latest_successful_job_id": "job_01J8X1234567890ABCDEF",
"last_error_summary": null,
"created_at": "2026-06-19T04:00:00Z",
"updated_at": "2026-06-19T04:05:00Z"
}
]
StatusCause
404バケットが見つかりません。

GET /v2/buckets/{bucket_id}/documents/{document_id}

Section titled “GET /v2/buckets/{bucket_id}/documents/{document_id}”

IDで単一のドキュメントを取得します。

ParameterTypeRequiredDescription
bucket_idstringYesバケット識別子。
document_idstringYesドキュメント識別子。

GET /v2/buckets/{bucket_id}/documents応答の単一アイテムと同じ形式です。

StatusCause
404バケットまたはドキュメントが見つかりません。

PATCH /v2/buckets/{bucket_id}/documents/{document_id}

Section titled “PATCH /v2/buckets/{bucket_id}/documents/{document_id}”

ドキュメントのメタデータを更新します。検索の可視性に影響する変更は、デフォルトで再インデックスをトリガーします。

ParameterTypeRequiredDescription
bucket_idstringYesバケット識別子。
document_idstringYesドキュメント識別子。
FieldTypeRequiredDefaultDescription
metadataobjectNo{}マージするメタデータ。
public_accessiblebooleanNonullドキュメントが公開されているかどうか。
privacy_levelintegerNonullプライバシーレベル。範囲は110
classificationstringNonullinternalpublicrestrictedconfidentialのいずれか。
review_statusstringNonullpendingapprovedrejectedのいずれか。
reindexbooleanNotrue更新後の再インデックスをキューに入れます。

GET /v2/buckets/{bucket_id}/documents/{document_id}応答と同じ形式です。

StatusCause
400無効なメタデータ。
404バケットまたはドキュメントが見つかりません。

DELETE /v2/buckets/{bucket_id}/documents/{document_id}

Section titled “DELETE /v2/buckets/{bucket_id}/documents/{document_id}”

ドキュメントの完全削除をキューに入れます。削除は非同期に実行され、ジョブIDを返します。

ParameterTypeRequiredDescription
bucket_idstringYesバケット識別子。
document_idstringYesドキュメント識別子。
{
"bucket_id": "product-docs",
"document_id": "doc_01J8X1234567890ABCDEF",
"job_id": "job_01J8Y1234567890ABCDEF",
"status": "queued",
"delete_requested_at": "2026-06-19T05:10:00Z"
}
StatusCause
404バケットまたはドキュメントが見つかりません。

バケット内のドキュメント全体にわたって表示されるメタデータキーと、それらの最も一般的な値を一覧表示します。

ParameterTypeRequiredDescription
bucket_idstringYesバケット識別子。
ParameterTypeRequiredDefaultDescription
limitintegerNo500キー用にスキャンする最大ドキュメント数。範囲は12000
values_per_keyintegerNo20キーあたりに返される最大値数。範囲は0100
{
"bucket_id": "product-docs",
"keys": [
{
"key": "product",
"document_count": 12,
"values": [
{"value": "schift", "count": 10},
{"value": "docs", "count": 2}
]
}
]
}
StatusCause
404バケットが見つかりません。

GET /v2/buckets/{bucket_id}/metadata-keys/{key}/values

Section titled “GET /v2/buckets/{bucket_id}/metadata-keys/{key}/values”

特定のメタデータキーで観察された値を一覧表示します。

ParameterTypeRequiredDescription
bucket_idstringYesバケット識別子。
keystringYesメタデータキー。
ParameterTypeRequiredDefaultDescription
limitintegerNo100最大の異なる値数。範囲は11000
document_limitintegerNo2000スキャンする最大ドキュメント数。範囲は110000
{
"bucket_id": "product-docs",
"key": "product",
"values": [
{"value": "schift", "count": 10},
{"value": "docs", "count": 2}
]
}
StatusCause
404バケットが見つからないか、メタデータキーが見つかりません。