{"data":[{"id":"openai-gpt-oss-120b","name":"gpt-oss-120b","display_name":"GPT OSS 120B","description":"A 120-billion-parameter open-weights GPT model from OpenAI designed for reasoning-intensive tasks with implicit caching support.","creator":"openai","family":"gpt_oss","tier":"","version":null,"type":"language","size_in_bn":120,"modalities":{"input":["image","text"],"output":["text"]},"context_window":131072,"max_output_tokens":131072,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2024-06","training_data_cutoff":null,"supported_reasoning_efforts":["default"],"tokenizer":"GPT","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":true,"reasoning":true,"web_search":true,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2025-08-05","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":23,"ids":["@cf/openai/gpt-oss-120b","accounts/fireworks/models/gpt-oss-120b","azure_ai/gpt-oss-120b","baseten/openai/gpt-oss-120b","bedrock_mantle/openai.gpt-oss-120b","cerebras/gpt-oss-120b","cloudflare/@cf/openai/gpt-oss-120b","crusoe/openai/gpt-oss-120b","databricks/databricks-gpt-oss-120b","deepinfra/openai/gpt-oss-120b","fireworks_ai/accounts/fireworks/models/gpt-oss-120b","fireworks_ai/gpt-oss-120b","gpt-oss-120b","gpt-oss-120b-low","gpt-oss-120b-maas","groq/openai/gpt-oss-120b","lemonade/gpt-oss-120b-mxfp-GGUF","novita/openai/gpt-oss-120b","ollama/gpt-oss:120b-cloud","openai-gpt-oss-120b","openai-reasoning-gpt-oss-120b","openai.gpt-oss-120b-1:0","openai/gpt-oss-120b","openai/gpt-oss-120b:free","openrouter/openai/gpt-oss-120b","ovhcloud/gpt-oss-120b","publishers/google/models/gpt-oss-120b-maas","replicate/openai/gpt-oss-120b","sambanova/gpt-oss-120b","scaleway/openai/gpt-oss-120b","tensormesh/openai/gpt-oss-120b","together_ai/openai/gpt-oss-120b","vertex_ai/openai/gpt-oss-120b-maas","wandb/openai/gpt-oss-120b","watsonx/openai/gpt-oss-120b"],"hf_likes":4719,"hf_downloads":3524674,"hf_downloads_all_time":32348365,"hf_trending_score":25,"updated_at":"2026-07-02 08:02:27"},{"id":"meta-llama-3-3-70b-instruct","name":"llama-3-3-70b-instruct","display_name":"Llama 3.3 70B Instruct","description":"Meta's 70B instruction-tuned LLM from Llama 3.3, optimized for complex instruction-following and deployed across multiple cloud regions.","creator":"meta","family":"llama","tier":"","version":"3-3","type":"language","size_in_bn":70,"modalities":{"input":["text"],"output":["text"]},"context_window":131072,"max_output_tokens":120000,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2023-12","training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":"Llama3","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2024-12-06","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":21,"ids":["accounts/fireworks/models/llama-v3p3-70b-instruct","azure_ai/Llama-3.3-70B-Instruct","crusoe/meta-llama/Llama-3.3-70B-Instruct","databricks/databricks-meta-llama-3-3-70b-instruct","deepinfra/meta-llama/Llama-3.3-70B-Instruct","fireworks_ai/accounts/fireworks/models/llama-v3p3-70b-instruct","gradient_ai/llama3.3-70b-instruct","groq/llama-3.3-70b-versatile","hyperbolic/meta-llama/Llama-3.3-70B-Instruct","lambda_ai/llama3.3-70b-instruct-fp8","llama-3-3-instruct-70b","llama-3.3-70b-instruct-maas","meta_llama/Llama-3.3-70B-Instruct","meta-llama-3-3-70b-instruct","meta-llama/llama-3.3-70b-instruct","meta-llama/llama-3.3-70b-instruct:free","meta-textgeneration-llama-3-3-70b-instruct","meta.llama3-3-70b-instruct-v1:0","meta.llama3-3-70b-instruct-v1:0:128k","nebius/meta-llama/Llama-3.3-70B-Instruct","novita/meta-llama/llama-3.3-70b-instruct","nscale/meta-llama/Llama-3.3-70B-Instruct","oci/meta.llama-3.3-70b-instruct","oci/meta.llama-3.3-70b-instruct-fp8-dynamic","ovhcloud/Meta-Llama-3_3-70B-Instruct","publishers/google/models/llama-3.3-70b-instruct-maas","publishers/meta/models/llama-3.3-70b-instruct-maas","sambanova/Meta-Llama-3.3-70B-Instruct","scaleway/meta/llama-3.3-70b-instruct","together_ai/meta-llama/Llama-3.3-70B-Instruct-Turbo-Free","us.meta.llama3-3-70b-instruct-v1:0","wandb/meta-llama/Llama-3.3-70B-Instruct","watsonx/meta-llama/llama-3-3-70b-instruct"],"hf_likes":2731,"hf_downloads":496024,"hf_downloads_all_time":10779619,"hf_trending_score":1.5,"updated_at":"2026-07-02 08:02:27"},{"id":"openai-gpt-oss-20b","name":"gpt-oss-20b","display_name":"GPT OSS 20B","description":"A 20-billion-parameter open-weights GPT model from OpenAI suited for reasoning and tool-use tasks at a smaller, more efficient scale.","creator":"openai","family":"gpt_oss","tier":"","version":null,"type":"language","size_in_bn":20,"modalities":{"input":["image","text"],"output":["text"]},"context_window":131072,"max_output_tokens":131072,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2024-06","training_data_cutoff":null,"supported_reasoning_efforts":["default"],"tokenizer":"GPT","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":true,"reasoning":true,"web_search":true,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2025-08-05","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":18,"ids":["@cf/openai/gpt-oss-20b","accounts/fireworks/models/gpt-oss-20b","bedrock_mantle/openai.gpt-oss-20b","cloudflare/@cf/openai/gpt-oss-20b","darkbloom/gpt-oss-20b","databricks/databricks-gpt-oss-20b","deepinfra/openai/gpt-oss-20b","fireworks_ai/accounts/fireworks/models/gpt-oss-20b","fireworks_ai/gpt-oss-20b","gpt-oss-20b","gpt-oss-20b-low","gpt-oss-20b-maas","groq/openai/gpt-oss-20b","lemonade/gpt-oss-20b-mxfp4-GGUF","novita/openai/gpt-oss-20b","ollama/gpt-oss:20b-cloud","openai-gpt-oss-20b","openai-reasoning-gpt-oss-20b","openai.gpt-oss-20b-1:0","openai/gpt-oss-20b","openai/gpt-oss-20b:free","openrouter/openai/gpt-oss-20b","ovhcloud/gpt-oss-20b","publishers/google/models/gpt-oss-20b-maas","replicateopenai/gpt-oss-20b","tensormesh/openai/gpt-oss-20b","together_ai/openai/gpt-oss-20b","vertex_ai/openai/gpt-oss-20b-maas","wandb/openai/gpt-oss-20b"],"hf_likes":4552,"hf_downloads":6455272,"hf_downloads_all_time":59707566,"hf_trending_score":12,"updated_at":"2026-07-02 08:02:27"},{"id":"meta-llama-3-1-70b-instruct","name":"llama-3-1-70b-instruct","display_name":"Llama 3.1 70B Instruct","description":"Meta's 70B instruction-tuned LLM with strong tool-use and multilingual capabilities, widely deployed across cloud regions for enterprise workloads.","creator":"meta","family":"llama","tier":"","version":"3-1","type":"language","size_in_bn":70,"modalities":{"input":["image","text"],"output":["text"]},"context_window":131072,"max_output_tokens":16384,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2023-12-31","training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":"Llama3","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2024-07-23","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":13,"ids":["accounts/fireworks/models/llama-v3p1-70b-instruct","accounts/fireworks/models/llama-v3p1-70b-instruct-1b","azure_ai/Meta-Llama-3.1-70B-Instruct","deepinfra/meta-llama/Meta-Llama-3.1-70B-Instruct","deepinfra/meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo","fireworks_ai/accounts/fireworks/models/llama-v3p1-70b-instruct","fireworks_ai/accounts/fireworks/models/llama-v3p1-70b-instruct-1b","friendliai/meta-llama-3.1-70b-instruct","hyperbolic/meta-llama/Meta-Llama-3.1-70B-Instruct","lambda_ai/llama3.1-70b-instruct-fp8","llama-3-1-instruct-70b","meta-llama-3-1-70b-instruct","meta-llama/llama-3.1-70b-instruct","meta-llama/Meta-Llama-3.1-70B-Instruct","meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo","meta-textgeneration-llama-3-1-70b-instruct","meta-textgenerationneuron-llama-3-1-70b-instruct","meta.llama3-1-70b-instruct-v1:0","meta.llama3-1-70b-instruct-v1:0:128k","nebius/meta-llama/Meta-Llama-3.1-70B-Instruct","oci/meta.llama-3.1-70b-instruct","ovhcloud/Meta-Llama-3_1-70B-Instruct","perplexity/llama-3.1-70b-instruct","together_ai/meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo","us.meta.llama3-1-70b-instruct-v1:0","vertex_ai/meta/llama-3.1-70b-instruct-maas"],"hf_likes":907,"hf_downloads":737459,"hf_downloads_all_time":20735812,"hf_trending_score":0,"updated_at":"2026-07-02 08:02:27"},{"id":"alibaba-qwen2-5-coder-32b-instruct","name":"qwen2-5-coder-32b-instruct","display_name":"Qwen2.5 Coder 32B Instruct","description":"A 32-billion-parameter instruction-tuned code LLM from Alibaba's Qwen2.5-Coder series, excelling at code generation, debugging, and explanation across many programming languages.","creator":"alibaba","family":"qwen2","tier":"","version":null,"type":"language","size_in_bn":32,"modalities":{"input":["text"],"output":["text"]},"context_window":131072,"max_output_tokens":32768,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2024-06-30","training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":"Qwen","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":"2024-11-11","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":8,"ids":["@cf/qwen/qwen2.5-coder-32b-instruct","accounts/fireworks/models/qwen2p5-coder-32b-instruct","accounts/fireworks/models/qwen2p5-coder-32b-instruct-128k","accounts/fireworks/models/qwen2p5-coder-32b-instruct-32k-rope","accounts/fireworks/models/qwen2p5-coder-32b-instruct-64k","alibaba-qwen2-5-coder-32b-instruct","cloudflare/@cf/qwen/qwen2.5-coder-32b-instruct","fireworks_ai/accounts/fireworks/models/qwen2p5-coder-32b-instruct","fireworks_ai/accounts/fireworks/models/qwen2p5-coder-32b-instruct-128k","fireworks_ai/accounts/fireworks/models/qwen2p5-coder-32b-instruct-32k-rope","fireworks_ai/accounts/fireworks/models/qwen2p5-coder-32b-instruct-64k","huggingface-llm-qwen2-5-coder-32b-instruct","hyperbolic/Qwen/Qwen2.5-Coder-32B-Instruct","lambda_ai/qwen25-coder-32b-instruct","nscale/Qwen/Qwen2.5-Coder-32B-Instruct","openrouter/qwen/qwen-2.5-coder-32b-instruct","ovhcloud/Qwen2.5-Coder-32B-Instruct","qwen/qwen-2.5-coder-32b-instruct","qwen2-5-coder-32b-instruct","qwen2.5-coder-32b-instruct"],"hf_likes":2008,"hf_downloads":1257495,"hf_downloads_all_time":5998607,"hf_trending_score":0,"updated_at":"2026-07-02 08:02:27"},{"id":"meta-llama-3-2-11b-vision-instruct","name":"meta-llama-3-2-11b-vision-instruct","display_name":"Llama 3.2 11B Vision Instruct","description":"Meta's 11B instruction-tuned vision-language model optimized for visual recognition, image reasoning, and captioning with multimodal input support.","creator":"meta","family":"mllama","tier":"","version":"3-2","type":"language","size_in_bn":11,"modalities":{"input":["image","text"],"output":["text"]},"context_window":131072,"max_output_tokens":16384,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2023-12-31","training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":"Llama3","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":"2024-09-25","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":8,"ids":["@cf/meta/llama-3.2-11b-vision-instruct","accounts/fireworks/models/llama-v3p2-11b-vision-instruct","azure_ai/Llama-3.2-11B-Vision-Instruct","cloudflare/@cf/meta/llama-3.2-11b-vision-instruct","deepinfra/meta-llama/Llama-3.2-11B-Vision-Instruct","fireworks_ai/accounts/fireworks/models/llama-v3p2-11b-vision-instruct","lambda_ai/llama3.2-11b-vision-instruct","meta-llama-3-2-11b-vision-instruct","meta-llama/llama-3.2-11b-vision-instruct","meta-llama/Llama-3.2-11B-Vision-Instruct","meta-vlm-llama-3-2-11b-vision-instruct","oci/meta.llama-3.2-11b-vision-instruct","watsonx/meta-llama/llama-3-2-11b-vision-instruct"],"hf_likes":null,"hf_downloads":null,"hf_downloads_all_time":null,"hf_trending_score":null,"updated_at":"2026-07-02 08:02:27"},{"id":"alibaba-qwen2-5-72b-instruct","name":"qwen2-5-72b-instruct","display_name":"Qwen2.5 72B Instruct","description":"A 72-billion-parameter instruction-tuned LLM from Alibaba's Qwen2.5 series, excelling at natural language understanding, summarization, and dialogue.","creator":"alibaba","family":"qwen2","tier":"","version":null,"type":"language","size_in_bn":72,"modalities":{"input":["text"],"output":["text"]},"context_window":131072,"max_output_tokens":16384,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2024-06-30","training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":"Qwen","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2024-09-19","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":7,"ids":["accounts/fireworks/models/qwen2p5-72b-instruct","alibaba-qwen2-5-72b-instruct","deepinfra/Qwen/Qwen2.5-72B-Instruct","fireworks_ai/accounts/fireworks/models/qwen2p5-72b-instruct","huggingface-llm-qwen2-5-72b-instruct","hyperbolic/Qwen/Qwen2.5-72B-Instruct","nebius/Qwen/Qwen2.5-72B-Instruct","novita/qwen/qwen-2.5-72b-instruct","qwen/qwen-2.5-72b-instruct","Qwen/Qwen2.5-72B-Instruct","qwen2-5-72b-instruct","qwen2.5-72b-instruct"],"hf_likes":927,"hf_downloads":457915,"hf_downloads_all_time":5817981,"hf_trending_score":1,"updated_at":"2026-07-02 08:02:27"},{"id":"google-gemma-3-27b-instruct","name":"gemma-3-27b-instruct","display_name":"Gemma 3 27B Instruct","description":"An instruction-tuned 27B Gemma 3 LLM with multimodal vision-language input and 128k context window.","creator":"google","family":"gemma3","tier":"","version":"3","type":"language","size_in_bn":27,"modalities":{"input":["image","text"],"output":["text"]},"context_window":131072,"max_output_tokens":16384,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2024-08-31","training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":"Gemini","capabilities":{"function_calling":true,"parallel_function_calling":false,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2025-03-12","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":7,"ids":["accounts/fireworks/models/gemma-3-27b-it","deepinfra/google/gemma-3-27b-it","fireworks_ai/accounts/fireworks/models/gemma-3-27b-it","gemini/gemma-3-27b-it","google-gemma-3-27b-instruct","google.gemma-3-27b-it","google/gemma-3-27b-it","google/gemma-3-27b-it:free","huggingface-vlm-gemma-3-27b-instruct","nebius/google/gemma-3-27b-it","novita/google/gemma-3-27b-it","scaleway/google/gemma-3-27b-it"],"hf_likes":1956,"hf_downloads":567671,"hf_downloads_all_time":12733530,"hf_trending_score":2,"updated_at":"2026-07-02 08:02:27"},{"id":"zhipu-glm-4-5-air","name":"glm-4-5-air","display_name":"GLM-4.5 Air","description":"A compact MoE variant of GLM-4.5 from Z AI, offering a lighter architecture while retaining strong agentic reasoning and tool-use performance.","creator":"zhipu","family":"glm4_moe","tier":"air","version":"4-5","type":"language","size_in_bn":110.469,"modalities":{"input":["text"],"output":["text"]},"context_window":131072,"max_output_tokens":98304,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2024-12-31","training_data_cutoff":null,"supported_reasoning_efforts":["default"],"tokenizer":"Other","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":true,"reasoning":true,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":true,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2025-07-25","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":7,"ids":["accounts/fireworks/models/glm-4p5-air","fireworks_ai/accounts/fireworks/models/glm-4p5-air","glm-4-5-air","novita/zai-org/glm-4.5-air","pinstripes/ps/glm-4.5-air","vercel_ai_gateway/zai/glm-4.5-air","z-ai/glm-4.5-air","z-ai/glm-4.5-air:free","zai-org/glm-4.5-air","zai/glm-4.5-air","zhipu-glm-4-5-air"],"hf_likes":599,"hf_downloads":389697,"hf_downloads_all_time":3025118,"hf_trending_score":2,"updated_at":"2026-07-02 08:02:27"},{"id":"alibaba-qwen2-5-vl-72b-instruct","name":"qwen2-5-vl-72b-instruct","display_name":"Qwen2.5 VL 72B Instruct","description":"A 72-billion-parameter multimodal vision-language LLM from Alibaba's Qwen2.5-VL series, delivering high-capacity image understanding and visual reasoning.","creator":"alibaba","family":"qwen2_5_vl","tier":"","version":null,"type":"language","size_in_bn":72,"modalities":{"input":["image","text"],"output":["text"]},"context_window":131072,"max_output_tokens":128000,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2024-06-30","training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":"Qwen","capabilities":{"function_calling":true,"parallel_function_calling":false,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2025-02-01","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":6,"ids":["accounts/fireworks/models/qwen2p5-vl-72b-instruct","alibaba-qwen2-5-vl-72b-instruct","fireworks_ai/accounts/fireworks/models/qwen2p5-vl-72b-instruct","nebius/Qwen/Qwen2.5-VL-72B-Instruct","novita/qwen/qwen2.5-vl-72b-instruct","ovhcloud/Qwen2.5-VL-72B-Instruct","qwen/qwen2.5-vl-72b-instruct","qwen2.5-vl-72b-instruct"],"hf_likes":609,"hf_downloads":103451,"hf_downloads_all_time":5812114,"hf_trending_score":1,"updated_at":"2026-07-02 08:02:27"}],"meta":{"updated_at":"","request_id":"dc3e692c-13d2-4a08-94af-9282c198d84f","execution_ms":10}}