コンテンツにスキップ

ジョブ

Show:

ジョブは、ドキュメントの取り込みや埋め込み、APIタスクの実行などの非同期作業単位を表します。/v1/jobs エンドポイントを使用して、組織内のジョブを検査、制御、クリーンアップします。

Note: すべての /v1/jobs エンドポイントは、Authorization: Bearer <token> ヘッダーにワークスペースAPIキーが必要です。読み取り操作は有効なキーを受け入れますが、書き込み操作(cancelreprocessdelete)には jobs:write スコープが必要です。

FieldTypeDescription
idstringユニークなジョブ識別子。
org_idstringジョブを所有する組織。
bucket_idstringジョブが属するバケット。
collection_idstring | nullジョブが対象とするコレクション(ある場合)。
document_idstring | nullリンクされた取り込みドキュメント(ある場合)。
workflow_idstring | nullリンクされたワークフロー(ある場合)。
source_entry_idstring | nullリンクされたソースエントリ(ある場合)。
priorityinteger数字が小さいほど先に実行されます(デフォルト 2)。
statusstringqueuedextractingchunkingembeddingindexingreadyfailedcancelled のいずれか。
s3_keystringソースファイルまたはアーティファクトのストレージキー。
file_namestring元のファイル名。
file_sizeintegerファイルサイズ(バイト単位)。
file_typestring | nullファイルタイプ、例:pdftxtembed_bulk
processing_typestring | nullsource_connectorbucket_page_reindex、または他のタスクタイプ。
estimated_costnumberキュー時の推定コスト。
actual_costnumber | null完了後の実際のコスト。
chunks_countinteger | null生成されたチャンクの数(該当する場合)。
failed_phasestring | null失敗したフェーズ(ステータスが failed の場合)。
error_categorystring | nullカテゴリ化されたエラー理由。
error_messagestring | null人間が読めるエラーメッセージ。
retryableboolean | null失敗が再試行可能かどうか。
retry_countinteger再試行の試行回数。
reprocess_of_job_idstring | nullこのジョブが再処理の再試行である場合の元のジョブID。
worker_idstring | null現在ジョブを処理しているワーカー。
scheduled_atstring | nullISO 8601スケジュール時間(延期された場合)。
started_atstring | nullISO 8601処理開始時間。
completed_atstring | nullISO 8601完了時間。
created_atstringISO 8601作成時間。
updated_atstringISO 8601最終更新時間。
metadata_snapshotobject | null監査の安全性のための元のドキュメントメタデータのスナップショット。

IDで単一のジョブを取得します。

ParameterTypeRequiredDescription
job_idstringYesジョブ識別子。
{
"id": "job_01J8X...",
"org_id": "org_abc123",
"bucket_id": "bucket_legal",
"collection_id": null,
"document_id": "doc_01J8X...",
"priority": 1,
"status": "ready",
"s3_key": "org_abc123/uploads/contract.pdf",
"file_name": "contract.pdf",
"file_size": 1048576,
"file_type": "pdf",
"estimated_cost": 0.05,
"actual_cost": 0.047,
"chunks_count": 42,
"failed_phase": null,
"error_category": null,
"error_message": null,
"retryable": null,
"retry_count": 0,
"reprocess_of_job_id": null,
"worker_id": null,
"scheduled_at": null,
"started_at": "2026-06-19T04:12:00Z",
"completed_at": "2026-06-19T04:12:08Z",
"created_at": "2026-06-19T04:11:55Z",
"updated_at": "2026-06-19T04:12:08Z",
"metadata_snapshot": {
"file_name": "contract.pdf",
"source_path": "org_abc123/uploads/contract.pdf",
"captured_at": "2026-06-19T04:11:55Z"
}
}
StatusCause
404ジョブが見つからないか、組織に属していません。

組織のジョブを新しい順に一覧表示します。

ParameterTypeRequiredDefaultDescription
bucket_idstringNo単一のバケットにフィルタリングします。
statusstringNo単一のステータスにフィルタリングします。
limitintegerNo50最大結果数。1から200の間で指定します。
[
{
"id": "job_01J8X...",
"org_id": "org_abc123",
"bucket_id": "bucket_legal",
"status": "ready",
"file_name": "contract.pdf",
"file_size": 1048576,
"file_type": "pdf",
"priority": 1,
"created_at": "2026-06-19T04:11:55Z",
"updated_at": "2026-06-19T04:12:08Z"
},
{
"id": "job_01J8Y...",
"org_id": "org_abc123",
"bucket_id": "bucket_hr",
"status": "failed",
"file_name": "handbook.docx",
"file_size": 512000,
"file_type": "docx",
"priority": 2,
"error_message": "Provider embedding timeout",
"created_at": "2026-06-19T03:00:00Z",
"updated_at": "2026-06-19T03:05:00Z"
}
]

ジョブに関連付けられたファイルを一覧表示します。Schiftジョブは現在単一ドキュメントであるため、最大1つのファイルを返します。レスポンスの形状はOpenAIのvector_store.fileオブジェクトを反映しています。

ParameterTypeRequiredDescription
job_idstringYesジョブ識別子。
{
"object": "list",
"data": [
{
"id": "doc_01J8X...",
"object": "vector_store.file",
"vector_store_id": "bucket_legal",
"status": "uploaded",
"filename": "contract.pdf",
"created_at": "2026-06-19T04:11:55Z"
}
],
"has_more": false
}
StatusCause
404ジョブが見つからないか、組織に属していません。

ジョブに関連付けられたソースファイルをダウンロードします。レスポンスは添付ファイルのContent-Dispositionヘッダー付きのバイナリストリームとして返されます。

ParameterTypeRequiredDescription
job_idstringYesジョブ識別子。

バイナリファイルの内容。Content-Typeはジョブのfile_typeから取得され、デフォルトはapplication/octet-streamです。

StatusCause
404ジョブが見つからない、ジョブにファイルがない、またはストレージからファイルを取得できませんでした。

キューに入っているか進行中のジョブをキャンセルします。

Note: このエンドポイントには jobs:write スコープが必要です。

ParameterTypeRequiredDescription
job_idstringYesジョブ識別子。
ParameterTypeRequiredDefaultDescription
forcebooleanNofalseジョブが進行中でも強制キャンセルします。
  • ジョブがすでに終端状態(readyfailedcancelled)にある場合、レスポンスは現在のステータスをdetail: "job already in terminal state"と共に返します。
  • ジョブが進行中でforcefalseの場合、エンドポイントは400を返し、?force=trueの使用を提案します。
  • force=trueの場合、ジョブは現在の進行中のステータスに関係なくcancelledとしてマークされます。
{
"status": "cancelled"
}
StatusCause
400進行中のジョブでforce=false
404ジョブが見つからないか、組織に属していません。
409ジョブがもはやキューに入っていない(競合状態)。

失敗したか他の終端状態のジョブを再処理する新しいジョブを作成します。新しいジョブは元のソース、バケット、コレクション、優先度をコピーし、reprocess_of_job_idを介してリンクします。

Note: このエンドポイントには jobs:write スコープが必要です。

ParameterTypeRequiredDescription
job_idstringYesジョブ識別子。
{
"id": "job_01J8Z...",
"org_id": "org_abc123",
"bucket_id": "bucket_legal",
"document_id": "doc_01J8X...",
"status": "queued",
"file_name": "contract.pdf",
"file_size": 1048576,
"priority": 1,
"reprocess_of_job_id": "job_01J8X...",
"created_at": "2026-06-19T05:00:00Z",
"updated_at": "2026-06-19T05:00:00Z"
}
StatusCause
400ジョブが終端状態にありません。
404ジョブが見つからないか、組織に属していません。

ジョブを削除します。進行中のジョブは削除できません。

Note: このエンドポイントには jobs:write スコープが必要です。

ParameterTypeRequiredDescription
job_idstringYesジョブ識別子。

成功時は204 No Content

StatusCause
400進行中のジョブを削除できません。
404ジョブが見つからないか、組織に属していません。

長時間進行中のジョブを失敗としてマークします。このエンドポイントは、デッドワーカーからの回復のためにcronまたはプラットフォーム管理者向けです。

Note: このエンドポイントは通常のワークスペースAPIキーを使用しません。以下のいずれかを受け入れます:

  • Authorization: Bearer <token>platform_admin JWTまたはAPIキー。
  • サーバーのCRON_SECRET環境変数と一致するX-Cron-Secretヘッダー。
ParameterTypeRequiredDefaultDescription
timeout_minutesintegerNo30ジョブが再処理されるまでにスタックしている必要がある時間。範囲は11440
HeaderRequiredDescription
X-Cron-SecretConditionalクラウドスケジューラ/CLI呼び出し用のCronシークレット。
AuthorizationConditionalUIまたは手動使用のためのBearer <platform_admin_token>
{
"timeout_minutes": 30,
"reaped_count": 2,
"jobs": [
{
"job_id": "job_01J8X...",
"org_id": "org_abc123",
"stuck_status": "embedding"
},
{
"job_id": "job_01J8Y...",
"org_id": "org_def456",
"stuck_status": "extracting"
}
]
}
StatusCause
401有効な認証が提供されていません。
403X-Cron-Secret ヘッダーが存在するが無効です。