{"data":[{"id":"deepseek-v3-324","name":"deepseek-v3-324","display_name":"DeepSeek V3 324","description":"The March 2024 update of DeepSeek V3 (V3-0324), a 671B MoE LLM representing an improved iteration over the original V3 release.","creator":"deepseek","family":"deepseek-v3","tier":"","version":"3.0","type":"language","size_in_bn":684.531,"modalities":{"input":["text"],"output":["text"]},"context_window":163840,"max_output_tokens":16384,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":null,"training_data_cutoff":null,"supported_reasoning_efforts":["default"],"tokenizer":null,"capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":false,"reasoning":true,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":null,"earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":13,"ids":["accounts/fireworks/models/deepseek-v3-0324","azure_ai/deepseek-v3-0324","baseten/deepseek-ai/DeepSeek-V3-0324","crusoe/deepseek-ai/DeepSeek-V3-0324","deepinfra/deepseek-ai/DeepSeek-V3-0324","deepseek-ai/DeepSeek-V3-0324","deepseek-v3-0324","deepseek-v3-324","deepseek/deepseek-v3-0324","fireworks_ai/accounts/fireworks/models/deepseek-v3-0324","gmi/deepseek-ai/DeepSeek-V3-0324","hyperbolic/deepseek-ai/DeepSeek-V3-0324","lambda_ai/deepseek-v3-0324","nebius/deepseek-ai/DeepSeek-V3-0324","novita/deepseek/deepseek-v3-0324","sambanova/DeepSeek-V3-0324","wandb/deepseek-ai/DeepSeek-V3-0324"],"hf_likes":3101,"hf_downloads":617973,"hf_downloads_all_time":4563386,"hf_trending_score":0,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"deepseek-v3-324","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.2,"max_input_per_1m":114,"min_output_per_1m":0.4,"max_output_per_1m":275,"min_cache_read_per_1m":0.135,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["lambda"],"provider_count":13},"providers":[],"regions":[],"region_info":{}}},{"id":"alibaba-qwq-32b","name":"qwq-32b","display_name":"QwQ 32B","description":"A 32B reasoning-focused LLM from Alibaba's Qwen team, designed to match frontier closed-model performance on complex reasoning and problem-solving tasks.","creator":"alibaba","family":"qwen2","tier":"","version":null,"type":"language","size_in_bn":32,"modalities":{"input":["text"],"output":["text"]},"context_window":131072,"max_output_tokens":16384,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2024-06-30","training_data_cutoff":null,"supported_reasoning_efforts":["default"],"tokenizer":"Qwen","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":false,"prompt_caching":false,"reasoning":true,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":"2025-03-05","earliest_deprecation_date":"2026-04-29","deprecated":false,"has_pricing":true,"provider_count":9,"ids":["@cf/qwen/qwq-32b","accounts/fireworks/models/qwq-32b","alibaba-qwq-32b","deepinfra/Qwen/QwQ-32B","fireworks_ai/accounts/fireworks/models/qwq-32b","huggingface-llm-qwq-32b","hyperbolic/Qwen/QwQ-32B","nebius/Qwen/QwQ-32B","nscale/Qwen/QwQ-32B","qwen/qwq-32b","qwq-32b","sambanova/QwQ-32B"],"hf_likes":2906,"hf_downloads":73024,"hf_downloads_all_time":2875672,"hf_trending_score":1,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"alibaba-qwq-32b","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.15,"max_input_per_1m":0.9,"min_output_per_1m":0.2,"max_output_per_1m":1,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["deepinfra","nebius"],"provider_count":9},"providers":[],"regions":[],"region_info":{}}},{"id":"deepseek-r1","name":"r1","display_name":"DeepSeek R1","description":"DeepSeek's flagship reasoning-focused LLM with strong performance in mathematics, coding, and logical inference, comparable to leading closed-source models.","creator":"deepseek","family":"deepseek-r1","tier":"","version":"1.0","type":"language","size_in_bn":684.531,"modalities":{"input":["text"],"output":["text"]},"context_window":163840,"max_output_tokens":65536,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2024-07-31","training_data_cutoff":null,"supported_reasoning_efforts":["default"],"tokenizer":"DeepSeek","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":true,"reasoning":true,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":true,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2025-01-20","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":14,"ids":["accounts/fireworks/models/deepseek-r1","azure_ai/deepseek-r1","deepinfra/deepseek-ai/DeepSeek-R1","deepseek-llm-r1","deepseek-r1","deepseek-r1-0120","deepseek-r1-qwen3-8b","deepseek-r1685","deepseek-reasoner","deepseek.r1-v1:0","deepseek/deepseek-r1","deepseek/deepseek-reasoner","fireworks_ai/accounts/fireworks/models/deepseek-r1","hyperbolic/deepseek-ai/DeepSeek-R1","nebius/deepseek-ai/DeepSeek-R1","openrouter/deepseek/deepseek-r1","replicate/deepseek-ai/deepseek-r1","sambanova/DeepSeek-R1","snowflake/deepseek-r1","together_ai/deepseek-ai/DeepSeek-R1","us.deepseek.r1-v1:0","vercel_ai_gateway/deepseek/deepseek-r1"],"hf_likes":13288,"hf_downloads":4020320,"hf_downloads_all_time":20204112,"hf_trending_score":20,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"deepseek-r1","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.28,"max_input_per_1m":5,"min_output_per_1m":0.4,"max_output_per_1m":10,"min_cache_read_per_1m":0.028,"min_cache_write_per_1m":null,"min_reasoning_per_1m":10,"cheapest_providers":["deepseek"],"provider_count":14},"providers":[],"regions":[],"region_info":{}}},{"id":"meta-llama-3-1-405b-instruct","name":"llama-3-1-405b-instruct","display_name":"Llama 3.1 405B Instruct","description":"Meta's 405B instruction-tuned LLM optimized for following complex instructions, with FP8 quantization for efficient large-scale inference.","creator":"meta","family":"llama","tier":"","version":"3-1","type":"language","size_in_bn":405,"modalities":{"input":["image","text"],"output":["text"]},"context_window":131072,"max_output_tokens":16384,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":null,"training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":null,"capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":"2024-07-23","earliest_deprecation_date":"2026-07","deprecated":false,"has_pricing":true,"provider_count":11,"ids":["accounts/fireworks/models/llama-v3p1-405b-instruct","azure_ai/Meta-Llama-3.1-405B-Instruct","databricks/databricks-meta-llama-3-1-405b-instruct","fireworks_ai/accounts/fireworks/models/llama-v3p1-405b-instruct","hyperbolic/meta-llama/Meta-Llama-3.1-405B-Instruct","lambda_ai/llama3.1-405b-instruct-fp8","llama-3-1-instruct-405b","meta-llama-3-1-405b-instruct","meta-textgeneration-llama-3-1-405b-instruct-fp8","meta.llama3-1-405b-instruct-v1:0","nebius/meta-llama/Meta-Llama-3.1-405B-Instruct","oci/meta.llama-3.1-405b-instruct","sambanova/Meta-Llama-3.1-405B-Instruct","together_ai/meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo","us.meta.llama3-1-405b-instruct-v1:0","vertex_ai/meta/llama-3.1-405b-instruct-maas"],"hf_likes":null,"hf_downloads":null,"hf_downloads_all_time":null,"hf_trending_score":null,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"meta-llama-3-1-405b-instruct","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.12,"max_input_per_1m":10.68,"min_output_per_1m":0.3,"max_output_per_1m":16,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["hyperbolic"],"provider_count":11},"providers":[],"regions":[],"region_info":{}}},{"id":"deepseek-v3","name":"v3","display_name":"DeepSeek V3","description":"DeepSeek's third-generation MoE LLM with 671B total parameters (37B activated per token), excelling at coding, reasoning, and tool use.","creator":"deepseek","family":"deepseek-v3","tier":"","version":"3.0","type":"language","size_in_bn":684.531,"modalities":{"input":["image","text"],"output":["text"]},"context_window":163840,"max_output_tokens":81920,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2024-07-31","training_data_cutoff":null,"supported_reasoning_efforts":["default"],"tokenizer":"DeepSeek","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":true,"reasoning":true,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":true,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2024-12-26","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":11,"ids":["accounts/fireworks/models/deepseek-v3","azure_ai/deepseek-v3","deepinfra/deepseek-ai/DeepSeek-V3","deepseek-ai/DeepSeek-V3","deepseek-chat","deepseek-v3","deepseek.v3-v1:0","deepseek/deepseek_v3","deepseek/deepseek-chat","deepseek/deepseek-v3","fireworks_ai/accounts/fireworks/models/deepseek-v3","hyperbolic/deepseek-ai/DeepSeek-V3","nebius/deepseek-ai/DeepSeek-V3","openrouter/deepseek/deepseek-chat","replicate/deepseek-ai/deepseek-v3","together_ai/deepseek-ai/DeepSeek-V3","vercel_ai_gateway/deepseek/deepseek-v3"],"hf_likes":4056,"hf_downloads":882009,"hf_downloads_all_time":15156328,"hf_trending_score":4,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"deepseek-v3","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.2,"max_input_per_1m":1.45,"min_output_per_1m":0.2,"max_output_per_1m":4.56,"min_cache_read_per_1m":0.028,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["hyperbolic"],"provider_count":11},"providers":[],"regions":[],"region_info":{}}},{"id":"alibaba-qwen2-5-72b-instruct","name":"qwen2-5-72b-instruct","display_name":"Qwen2.5 72B Instruct","description":"A 72-billion-parameter instruction-tuned LLM from Alibaba's Qwen2.5 series, excelling at natural language understanding, summarization, and dialogue.","creator":"alibaba","family":"qwen2","tier":"","version":null,"type":"language","size_in_bn":72,"modalities":{"input":["text"],"output":["text"]},"context_window":131072,"max_output_tokens":16384,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2024-06-30","training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":"Qwen","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2024-09-19","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":8,"ids":["accounts/fireworks/models/qwen2p5-72b-instruct","alibaba-qwen2-5-72b-instruct","deepinfra/Qwen/Qwen2.5-72B-Instruct","fireworks_ai/accounts/fireworks/models/qwen2p5-72b-instruct","huggingface-llm-qwen2-5-72b-instruct","hyperbolic/Qwen/Qwen2.5-72B-Instruct","nebius/Qwen/Qwen2.5-72B-Instruct","novita/qwen/qwen-2.5-72b-instruct","qwen/qwen-2.5-72b-instruct","Qwen/Qwen2.5-72B-Instruct","qwen2-5-72b-instruct","qwen2.5-72b-instruct"],"hf_likes":927,"hf_downloads":457915,"hf_downloads_all_time":5817981,"hf_trending_score":1,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"alibaba-qwen2-5-72b-instruct","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.12,"max_input_per_1m":1.4,"min_output_per_1m":0.3,"max_output_per_1m":5.6,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["deepinfra","hyperbolic"],"provider_count":8},"providers":[],"regions":[],"region_info":{}}},{"id":"meta-llama-3-3-70b-instruct","name":"llama-3-3-70b-instruct","display_name":"Llama 3.3 70B Instruct","description":"Meta's 70B instruction-tuned LLM from Llama 3.3, optimized for complex instruction-following and deployed across multiple cloud regions.","creator":"meta","family":"llama","tier":"","version":"3-3","type":"language","size_in_bn":70,"modalities":{"input":["text"],"output":["text"]},"context_window":131072,"max_output_tokens":120000,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2023-12","training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":"Llama3","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2024-12-06","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":20,"ids":["accounts/fireworks/models/llama-v3p3-70b-instruct","azure_ai/Llama-3.3-70B-Instruct","crusoe/meta-llama/Llama-3.3-70B-Instruct","databricks/databricks-meta-llama-3-3-70b-instruct","deepinfra/meta-llama/Llama-3.3-70B-Instruct","fireworks_ai/accounts/fireworks/models/llama-v3p3-70b-instruct","gradient_ai/llama3.3-70b-instruct","groq/llama-3.3-70b-versatile","hyperbolic/meta-llama/Llama-3.3-70B-Instruct","lambda_ai/llama3.3-70b-instruct-fp8","llama-3-3-instruct-70b","llama-3.3-70b-instruct-maas","meta_llama/Llama-3.3-70B-Instruct","meta-llama-3-3-70b-instruct","meta-llama/llama-3.3-70b-instruct","meta-llama/llama-3.3-70b-instruct:free","meta-textgeneration-llama-3-3-70b-instruct","meta.llama3-3-70b-instruct-v1:0","meta.llama3-3-70b-instruct-v1:0:128k","nebius/meta-llama/Llama-3.3-70B-Instruct","novita/meta-llama/llama-3.3-70b-instruct","nscale/meta-llama/Llama-3.3-70B-Instruct","oci/meta.llama-3.3-70b-instruct","oci/meta.llama-3.3-70b-instruct-fp8-dynamic","ovhcloud/Meta-Llama-3_3-70B-Instruct","publishers/google/models/llama-3.3-70b-instruct-maas","publishers/meta/models/llama-3.3-70b-instruct-maas","sambanova/Meta-Llama-3.3-70B-Instruct","together_ai/meta-llama/Llama-3.3-70B-Instruct-Turbo-Free","us.meta.llama3-3-70b-instruct-v1:0","wandb/meta-llama/Llama-3.3-70B-Instruct","watsonx/meta-llama/llama-3-3-70b-instruct"],"hf_likes":2731,"hf_downloads":496024,"hf_downloads_all_time":10779619,"hf_trending_score":1.5,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"meta-llama-3-3-70b-instruct","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.1,"max_input_per_1m":71,"min_output_per_1m":0.2,"max_output_per_1m":71,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["openrouter"],"provider_count":20},"providers":[],"regions":[],"region_info":{}}},{"id":"alibaba-qwen2-5-32b-instruct","name":"qwen2-5-32b-instruct","display_name":"Qwen2.5 32B Instruct","description":"A 32-billion-parameter instruction-tuned LLM from Alibaba's Qwen2.5 series, optimized for following complex instructions and text generation tasks.","creator":"alibaba","family":"qwen2","tier":"","version":null,"type":"language","size_in_bn":32,"modalities":{"input":["text"],"output":["text"]},"context_window":131072,"max_output_tokens":8192,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":null,"training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":null,"capabilities":{"function_calling":true,"parallel_function_calling":false,"structured_outputs":false,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":null,"earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":3,"ids":["accounts/fireworks/models/qwen2p5-32b-instruct","alibaba-qwen2-5-32b-instruct","fireworks_ai/accounts/fireworks/models/qwen2p5-32b-instruct","huggingface-llm-qwen2-5-32b-instruct","nebius/Qwen/Qwen2.5-32B-Instruct","qwen2.5-32b-instruct"],"hf_likes":null,"hf_downloads":null,"hf_downloads_all_time":null,"hf_trending_score":null,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"alibaba-qwen2-5-32b-instruct","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.06,"max_input_per_1m":0.9,"min_output_per_1m":0.2,"max_output_per_1m":2.8,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["nebius"],"provider_count":3},"providers":[],"regions":[],"region_info":{}}},{"id":"meta-llama-3-1-70b-instruct","name":"llama-3-1-70b-instruct","display_name":"Llama 3.1 70B Instruct","description":"Meta's 70B instruction-tuned LLM with strong tool-use and multilingual capabilities, widely deployed across cloud regions for enterprise workloads.","creator":"meta","family":"llama","tier":"","version":"3-1","type":"language","size_in_bn":70,"modalities":{"input":["image","text"],"output":["text"]},"context_window":131072,"max_output_tokens":16384,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2023-12-31","training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":"Llama3","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2024-07-23","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":13,"ids":["accounts/fireworks/models/llama-v3p1-70b-instruct","accounts/fireworks/models/llama-v3p1-70b-instruct-1b","azure_ai/Meta-Llama-3.1-70B-Instruct","deepinfra/meta-llama/Meta-Llama-3.1-70B-Instruct","deepinfra/meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo","fireworks_ai/accounts/fireworks/models/llama-v3p1-70b-instruct","fireworks_ai/accounts/fireworks/models/llama-v3p1-70b-instruct-1b","friendliai/meta-llama-3.1-70b-instruct","hyperbolic/meta-llama/Meta-Llama-3.1-70B-Instruct","lambda_ai/llama3.1-70b-instruct-fp8","llama-3-1-instruct-70b","meta-llama-3-1-70b-instruct","meta-llama/llama-3.1-70b-instruct","meta-llama/Meta-Llama-3.1-70B-Instruct","meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo","meta-textgeneration-llama-3-1-70b-instruct","meta-textgenerationneuron-llama-3-1-70b-instruct","meta.llama3-1-70b-instruct-v1:0","meta.llama3-1-70b-instruct-v1:0:128k","nebius/meta-llama/Meta-Llama-3.1-70B-Instruct","oci/meta.llama-3.1-70b-instruct","ovhcloud/Meta-Llama-3_1-70B-Instruct","perplexity/llama-3.1-70b-instruct","together_ai/meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo","us.meta.llama3-1-70b-instruct-v1:0","vertex_ai/meta/llama-3.1-70b-instruct-maas"],"hf_likes":907,"hf_downloads":737459,"hf_downloads_all_time":20735812,"hf_trending_score":0,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"meta-llama-3-1-70b-instruct","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.12,"max_input_per_1m":2.68,"min_output_per_1m":0.3,"max_output_per_1m":3.54,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["hyperbolic","lambda"],"provider_count":13},"providers":[],"regions":[],"region_info":{}}},{"id":"meta-llama-3-1-8b-instruct","name":"llama-3-1-8b-instruct","display_name":"Llama 3.1 8B Instruct","description":"Meta's 8B instruction-tuned LLM optimized for fast, cost-effective deployment across multiple cloud regions with strong instruction-following performance.","creator":"meta","family":"llama","tier":"","version":"3-1","type":"language","size_in_bn":8,"modalities":{"input":["image","text"],"output":["text"]},"context_window":200000,"max_output_tokens":128000,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2023-12-31","training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":"Llama3","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2024-07-23","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":21,"ids":["@cf/meta/llama-3.1-8b-instruct","accounts/fireworks/models/full-llama-v3p1-8b-instruct-8b-fp8","accounts/fireworks/models/full-llama-v3p1-8b-instruct-8b-fp8-amd","accounts/fireworks/models/llama-v3p1-8b-instruct","azure_ai/Meta-Llama-3.1-8B-Instruct","databricks/databricks-meta-llama-3-1-8b-instruct","deepinfra/meta-llama/Meta-Llama-3.1-8B-Instruct","deepinfra/meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo","fireworks_ai/accounts/fireworks/models/llama-v3p1-8b-instruct","friendliai/meta-llama-3.1-8b-instruct","groq/llama-3.1-8b-instant","hyperbolic/meta-llama/Meta-Llama-3.1-8B-Instruct","lambda_ai/llama3.1-8b-instruct","llama-3-1-instruct-8b","meta-llama-3-1-8b-instruct","meta-llama/llama-3.1-8b-instruct","meta-llama/Meta-Llama-3.1-8B-Instruct","meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo","meta-textgeneration-llama-3-1-8b-instruct","meta-textgenerationneuron-llama-3-1-8b-instruct","meta.llama3-1-8b-instruct-v1:0","meta.llama3-1-8b-instruct-v1:0:128k","nebius/meta-llama/Meta-Llama-3.1-8B-Instruct","novita/meta-llama/llama-3.1-8b-instruct","nscale/meta-llama/Llama-3.1-8B-Instruct","oci/meta.llama-3.1-8b-instruct","ovhcloud/Llama-3.1-8B-Instruct","perplexity/llama-3.1-8b-instruct","sambanova/Meta-Llama-3.1-8B-Instruct","together_ai/meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo","us.meta.llama3-1-8b-instruct-v1:0","vertex_ai/meta/llama-3.1-8b-instruct-maas","wandb/meta-llama/Llama-3.1-8B-Instruct"],"hf_likes":5731,"hf_downloads":9306502,"hf_downloads_all_time":140394735,"hf_trending_score":24,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"meta-llama-3-1-8b-instruct","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.02,"max_input_per_1m":22,"min_output_per_1m":0.03,"max_output_per_1m":22,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["huggingface","nebius","novita","openrouter"],"provider_count":21},"providers":[],"regions":[],"region_info":{}}},{"id":"baai-bge-en-icl","name":"bge-en-icl","display_name":"BGE EN ICL","description":"An in-context learning English embedding model from BAAI's BGE series, enabling task-specific embeddings via few-shot examples.","creator":"baai","family":"embed","tier":"","version":null,"type":"embedding","size_in_bn":null,"modalities":{"input":["text"],"output":["embedding"]},"context_window":32768,"max_output_tokens":null,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":null,"training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":null,"capabilities":{"function_calling":false,"parallel_function_calling":false,"structured_outputs":false,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":null,"earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":1,"ids":["baai-bge-en-icl","BAAI/bge-en-icl","nebius/BAAI/bge-en-icl"],"hf_likes":null,"hf_downloads":null,"hf_downloads_all_time":null,"hf_trending_score":null,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"baai-bge-en-icl","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.01,"max_input_per_1m":0.01,"min_output_per_1m":null,"max_output_per_1m":null,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["nebius"],"provider_count":1},"providers":[],"regions":[],"region_info":{}}},{"id":"baai-bge-multilingual-gemma2","name":"bge-multilingual-gemma2","display_name":"BGE Multilingual Gemma2","description":"A multilingual text embedding model built on the Gemma 2 architecture, enabling high-quality cross-lingual semantic representations.","creator":"baai","family":"embed","tier":"","version":null,"type":"embedding","size_in_bn":null,"modalities":{"input":["text"],"output":["embedding"]},"context_window":8192,"max_output_tokens":null,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":null,"training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":null,"capabilities":{"function_calling":false,"parallel_function_calling":false,"structured_outputs":false,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":null,"earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":1,"ids":["baai-bge-multilingual-gemma2","nebius/BAAI/bge-multilingual-gemma2"],"hf_likes":null,"hf_downloads":null,"hf_downloads_all_time":null,"hf_trending_score":null,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"baai-bge-multilingual-gemma2","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.01,"max_input_per_1m":0.01,"min_output_per_1m":null,"max_output_per_1m":null,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["nebius"],"provider_count":1},"providers":[],"regions":[],"region_info":{}}},{"id":"deepseek-r1-528","name":"deepseek-r1-528","display_name":"DeepSeek R1 528","description":"The DeepSeek R1 0528 update, a reasoning-focused MoE LLM with improved chain-of-thought capabilities over the original R1 release.","creator":"deepseek","family":"deepseek-r1","tier":"","version":"1.0","type":"language","size_in_bn":684.531,"modalities":{"input":["pdf","text"],"output":["text"]},"context_window":164000,"max_output_tokens":32768,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2025-03-31","training_data_cutoff":null,"supported_reasoning_efforts":["default"],"tokenizer":"DeepSeek","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":true,"reasoning":true,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":true,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2025-05-28","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":12,"ids":["accounts/fireworks/models/deepseek-r1-0528","crusoe/deepseek-ai/DeepSeek-R1-0528","deepinfra/deepseek-ai/DeepSeek-R1-0528","deepseek-ai/DeepSeek-R1-0528","deepseek-llm-r1-0528","deepseek-r1-0528-maas","deepseek-r1-528","deepseek/deepseek-r1-0528","fireworks_ai/accounts/fireworks/models/deepseek-r1-0528","hyperbolic/deepseek-ai/DeepSeek-R1-0528","lambda_ai/deepseek-r1-0528","nebius/deepseek-ai/DeepSeek-R1-0528","novita/deepseek/deepseek-r1-0528","openrouter/deepseek/deepseek-r1-0528","publishers/google/models/deepseek-r1-0528-maas","vertex_ai/deepseek-ai/deepseek-r1-0528-maas","wandb/deepseek-ai/DeepSeek-R1-0528"],"hf_likes":2445,"hf_downloads":707890,"hf_downloads_all_time":6472632,"hf_trending_score":1,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"deepseek-r1-528","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.2,"max_input_per_1m":135,"min_output_per_1m":0.25,"max_output_per_1m":540,"min_cache_read_per_1m":0.35,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["lambda"],"provider_count":12},"providers":[],"regions":[],"region_info":{}}},{"id":"google-gemma-3-27b-instruct","name":"gemma-3-27b-instruct","display_name":"Gemma 3 27B Instruct","description":"An instruction-tuned 27B Gemma 3 LLM with multimodal vision-language input and 128k context window.","creator":"google","family":"gemma3","tier":"","version":"3","type":"language","size_in_bn":27,"modalities":{"input":["image","text"],"output":["text"]},"context_window":131072,"max_output_tokens":16384,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2024-08-31","training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":"Gemini","capabilities":{"function_calling":true,"parallel_function_calling":false,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2025-03-12","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":6,"ids":["accounts/fireworks/models/gemma-3-27b-it","deepinfra/google/gemma-3-27b-it","fireworks_ai/accounts/fireworks/models/gemma-3-27b-it","gemini/gemma-3-27b-it","google-gemma-3-27b-instruct","google.gemma-3-27b-it","google/gemma-3-27b-it","google/gemma-3-27b-it:free","huggingface-vlm-gemma-3-27b-instruct","nebius/google/gemma-3-27b-it","novita/google/gemma-3-27b-it"],"hf_likes":1956,"hf_downloads":567671,"hf_downloads_all_time":12733530,"hf_trending_score":2,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"google-gemma-3-27b-instruct","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.06,"max_input_per_1m":0.9,"min_output_per_1m":0.16,"max_output_per_1m":0.9,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["nebius"],"provider_count":6},"providers":[],"regions":[],"region_info":{}}},{"id":"nousresearch-hermes-3-llama-3-1-405b","name":"hermes-3-llama-3-1-405b","display_name":"Hermes 3 Llama 3.1 405B","description":"A 405B-parameter Llama 3.1-based LLM from Nous Research fine-tuned for advanced roleplaying, reasoning, and agentic multi-turn conversation.","creator":"nousresearch","family":"llama","tier":"","version":null,"type":"language","size_in_bn":405,"modalities":{"input":["text"],"output":["text"]},"context_window":131072,"max_output_tokens":16384,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2023-12-31","training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":"Llama3","capabilities":{"function_calling":true,"parallel_function_calling":false,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2024-08-16","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":3,"ids":["deepinfra/NousResearch/Hermes-3-Llama-3.1-405B","nebius/NousResearch/Hermes-3-Llama-3.1-405B","nousresearch-hermes-3-llama-3-1-405b","nousresearch/hermes-3-llama-3.1-405b","NousResearch/Hermes-3-Llama-3.1-405B","nousresearch/hermes-3-llama-3.1-405b:free"],"hf_likes":null,"hf_downloads":null,"hf_downloads_all_time":null,"hf_trending_score":null,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"nousresearch-hermes-3-llama-3-1-405b","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":1,"max_input_per_1m":1,"min_output_per_1m":1,"max_output_per_1m":3,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["deepinfra","nebius","openrouter"],"provider_count":3},"providers":[],"regions":[],"region_info":{}}},{"id":"nvidia-llama-3-1-nemotron-1-ultra-253b","name":"llama-3-1-nemotron-1-ultra-253b","display_name":"Llama 3.1 Nemotron 1 Ultra 253B","description":"A 253B-parameter ultra-scale LLM fine-tuned by NVIDIA on Llama 3.1, optimized for advanced reasoning and high-accuracy agentic tasks.","creator":"nvidia","family":"llama","tier":"ultra","version":"1","type":"language","size_in_bn":253,"modalities":{"input":["text"],"output":["text"]},"context_window":128000,"max_output_tokens":null,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":null,"training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":null,"capabilities":{"function_calling":true,"parallel_function_calling":false,"structured_outputs":false,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":null,"earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":1,"ids":["llama-3-1-nemotron-ultra-253b-v1-reasoning","nebius/nvidia/Llama-3.1-Nemotron-Ultra-253B-v1","nvidia-llama-3-1-nemotron-1-ultra-253b"],"hf_likes":null,"hf_downloads":null,"hf_downloads_all_time":null,"hf_trending_score":null,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"nvidia-llama-3-1-nemotron-1-ultra-253b","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.6,"max_input_per_1m":0.6,"min_output_per_1m":1.8,"max_output_per_1m":1.8,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["nebius"],"provider_count":1},"providers":[],"regions":[],"region_info":{}}},{"id":"nvidia-llama-3-3-nemotron-1-super-49b","name":"llama-3-3-nemotron-1-super-49b","display_name":"Llama 3.3 Nemotron 1 Super 49B","description":"A 49B-parameter Nemotron Super model derived from Llama 3.3, designed by NVIDIA for high-efficiency reasoning and conversational AI at version 1.","creator":"nvidia","family":"llama","tier":"super","version":"1","type":"language","size_in_bn":49,"modalities":{"input":["text"],"output":["text"]},"context_window":131072,"max_output_tokens":null,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":null,"training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":null,"capabilities":{"function_calling":true,"parallel_function_calling":false,"structured_outputs":false,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":null,"earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":1,"ids":["nebius/nvidia/Llama-3.3-Nemotron-Super-49B-v1","nvidia-llama-3-3-nemotron-1-super-49b"],"hf_likes":null,"hf_downloads":null,"hf_downloads_all_time":null,"hf_trending_score":null,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"nvidia-llama-3-3-nemotron-1-super-49b","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.1,"max_input_per_1m":0.1,"min_output_per_1m":0.4,"max_output_per_1m":0.4,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["nebius"],"provider_count":1},"providers":[],"regions":[],"region_info":{}}},{"id":"meta-llamaguard-3-8b","name":"meta-llamaguard-3-8b","display_name":"LlamaGuard 3 8B","description":"An 8B parameter content safety model for classifying harmful content in LLM prompts and responses across multiple risk categories.","creator":"meta","family":"llama","tier":"","version":"3","type":"language","size_in_bn":8,"modalities":{"input":["text"],"output":["text"]},"context_window":131072,"max_output_tokens":16384,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2023-12-31","training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":"Llama3","capabilities":{"function_calling":false,"parallel_function_calling":false,"structured_outputs":false,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":"2025-02-12","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":5,"ids":["@cf/meta/llama-guard-3-8b","accounts/fireworks/models/llama-guard-3-8b","deepinfra/meta-llama/Llama-Guard-3-8B","fireworks_ai/accounts/fireworks/models/llama-guard-3-8b","meta-llama/llama-guard-3-8b","meta-llamaguard-3-8b","meta-textgeneration-llama-guard-3-8b","meta-textgenerationneuron-llama-guard-3-8b","nebius/meta-llama/Llama-Guard-3-8B","sambanova/Meta-Llama-Guard-3-8B"],"hf_likes":291,"hf_downloads":131512,"hf_downloads_all_time":4949411,"hf_trending_score":0.5,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"meta-llamaguard-3-8b","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.02,"max_input_per_1m":0.484,"min_output_per_1m":0.03,"max_output_per_1m":0.3,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["nebius"],"provider_count":5},"providers":[],"regions":[],"region_info":{}}},{"id":"mistral-nemo-instruct","name":"mistral-nemo-instruct","display_name":"Nemo Instruct (24.07)","description":"Instruction-tuned variant of the Mistral Nemo 12B model, designed for multilingual conversational and task-following applications.","creator":"mistral","family":"mistral","tier":"","version":null,"type":"language","size_in_bn":null,"modalities":{"input":["text"],"output":["text"]},"context_window":131072,"max_output_tokens":512,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":null,"training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":null,"capabilities":{"function_calling":true,"parallel_function_calling":false,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":null,"earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":5,"ids":["accounts/fireworks/models/mistral-nemo-instruct-2407","deepinfra/mistralai/Mistral-Nemo-Instruct-2407","fireworks_ai/accounts/fireworks/models/mistral-nemo-instruct-2407","gradient_ai/mistral-nemo-instruct-2407","huggingface-llm-mistral-nemo-instruct-2407","mistral-nemo-instruct","mistralai/Mistral-Nemo-Instruct-2407","nebius/mistralai/Mistral-Nemo-Instruct-2407","ovhcloud/Mistral-Nemo-Instruct-2407"],"hf_likes":null,"hf_downloads":null,"hf_downloads_all_time":null,"hf_trending_score":null,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"mistral-nemo-instruct","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.02,"max_input_per_1m":0.3,"min_output_per_1m":0.04,"max_output_per_1m":0.3,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["deepinfra"],"provider_count":5},"providers":[],"regions":[],"region_info":{}}},{"id":"alibaba-qwen2-vl-72b-instruct","name":"qwen2-vl-72b-instruct","display_name":"Qwen2 VL 72B Instruct","description":"A 72-billion-parameter multimodal vision-language LLM from Alibaba's Qwen2-VL series, offering high-capacity visual reasoning and image-text generation.","creator":"alibaba","family":"qwen2_vl","tier":"","version":null,"type":"language","size_in_bn":72,"modalities":{"input":["image"],"output":["text"]},"context_window":131072,"max_output_tokens":2048,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":null,"training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":null,"capabilities":{"function_calling":true,"parallel_function_calling":false,"structured_outputs":false,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":null,"earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":3,"ids":["accounts/fireworks/models/qwen2-vl-72b-instruct","alibaba-qwen2-vl-72b-instruct","fireworks_ai/accounts/fireworks/models/qwen2-vl-72b-instruct","nebius/Qwen/Qwen2-VL-72B-Instruct","qwen/qwen-2-vl-72b-instruct","qwen2-vl-72b-instruct"],"hf_likes":null,"hf_downloads":null,"hf_downloads_all_time":null,"hf_trending_score":null,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"alibaba-qwen2-vl-72b-instruct","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.13,"max_input_per_1m":2.294,"min_output_per_1m":0.4,"max_output_per_1m":6.881,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["nebius"],"provider_count":3},"providers":[],"regions":[],"region_info":{}}},{"id":"alibaba-qwen2-vl-7b-instruct","name":"qwen2-vl-7b-instruct","display_name":"Qwen2 VL 7B Instruct","description":"A 7-billion-parameter multimodal vision-language LLM from Alibaba's Qwen2-VL series, enabling efficient image understanding and visual question answering.","creator":"alibaba","family":"qwen2_vl","tier":"","version":null,"type":"language","size_in_bn":7,"modalities":{"input":["image"],"output":["text"]},"context_window":131072,"max_output_tokens":null,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":null,"training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":null,"capabilities":{"function_calling":false,"parallel_function_calling":false,"structured_outputs":false,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":null,"earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":2,"ids":["accounts/fireworks/models/qwen2-vl-7b-instruct","alibaba-qwen2-vl-7b-instruct","fireworks_ai/accounts/fireworks/models/qwen2-vl-7b-instruct","huggingface-vlm-qwen2-vl-7b-instruct","nebius/Qwen/Qwen2-VL-7B-Instruct"],"hf_likes":null,"hf_downloads":null,"hf_downloads_all_time":null,"hf_trending_score":null,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"alibaba-qwen2-vl-7b-instruct","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.02,"max_input_per_1m":0.2,"min_output_per_1m":0.06,"max_output_per_1m":0.2,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["nebius"],"provider_count":2},"providers":[],"regions":[],"region_info":{}}},{"id":"alibaba-qwen2-5-coder-7b","name":"qwen2-5-coder-7b","display_name":"Qwen2.5 Coder 7B","description":"A 7-billion-parameter base code-specialized LLM from Alibaba's Qwen2.5-Coder series, offering efficient code generation and understanding.","creator":"alibaba","family":"qwen2","tier":"","version":null,"type":"language","size_in_bn":7,"modalities":{"input":["text"],"output":["text"]},"context_window":32768,"max_output_tokens":8192,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":null,"training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":null,"capabilities":{"function_calling":true,"parallel_function_calling":false,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":null,"earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":3,"ids":["accounts/fireworks/models/qwen2p5-coder-7b","alibaba-qwen2-5-coder-7b","fireworks_ai/accounts/fireworks/models/qwen2p5-coder-7b","llamagate/qwen2.5-coder-7b","nebius/Qwen/Qwen2.5-Coder-7B"],"hf_likes":null,"hf_downloads":null,"hf_downloads_all_time":null,"hf_trending_score":null,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"alibaba-qwen2-5-coder-7b","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.01,"max_input_per_1m":0.2,"min_output_per_1m":0.03,"max_output_per_1m":0.2,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["nebius"],"provider_count":3},"providers":[],"regions":[],"region_info":{}}},{"id":"alibaba-qwen2-5-vl-72b-instruct","name":"qwen2-5-vl-72b-instruct","display_name":"Qwen2.5 VL 72B Instruct","description":"A 72-billion-parameter multimodal vision-language LLM from Alibaba's Qwen2.5-VL series, delivering high-capacity image understanding and visual reasoning.","creator":"alibaba","family":"qwen2_5_vl","tier":"","version":null,"type":"language","size_in_bn":72,"modalities":{"input":["image","text"],"output":["text"]},"context_window":131072,"max_output_tokens":128000,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2024-06-30","training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":"Qwen","capabilities":{"function_calling":true,"parallel_function_calling":false,"structured_outputs":true,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2025-02-01","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":7,"ids":["accounts/fireworks/models/qwen2p5-vl-72b-instruct","alibaba-qwen2-5-vl-72b-instruct","fireworks_ai/accounts/fireworks/models/qwen2p5-vl-72b-instruct","nebius/Qwen/Qwen2.5-VL-72B-Instruct","novita/qwen/qwen2.5-vl-72b-instruct","ovhcloud/Qwen2.5-VL-72B-Instruct","qwen/qwen2.5-vl-72b-instruct","qwen2.5-vl-72b-instruct"],"hf_likes":609,"hf_downloads":103451,"hf_downloads_all_time":5812114,"hf_trending_score":1,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"alibaba-qwen2-5-vl-72b-instruct","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.13,"max_input_per_1m":2.8,"min_output_per_1m":0.4,"max_output_per_1m":8.4,"min_cache_read_per_1m":0.4,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["nebius"],"provider_count":7},"providers":[],"regions":[],"region_info":{}}},{"id":"alibaba-qwen3-14b","name":"qwen3-14b","display_name":"Qwen3 14B","description":"A 14-billion-parameter LLM from Alibaba's Qwen3 series with strong reasoning and tool-use capabilities for complex instruction-following tasks.","creator":"alibaba","family":"qwen3","tier":"","version":null,"type":"language","size_in_bn":14,"modalities":{"input":["text"],"output":["text"]},"context_window":131702,"max_output_tokens":40960,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2025-03-31","training_data_cutoff":null,"supported_reasoning_efforts":["default"],"tokenizer":"Qwen3","capabilities":{"function_calling":true,"parallel_function_calling":false,"structured_outputs":true,"prompt_caching":false,"reasoning":true,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2025-04-28","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":7,"ids":["accounts/fireworks/models/qwen3-14b","alibaba-qwen3-14b","alibaba/qwen-3-14b","deepinfra/Qwen/Qwen3-14B","fireworks_ai/accounts/fireworks/models/qwen3-14b","huggingface-reasoning-qwen3-14b","nebius/Qwen/Qwen3-14B","qwen/qwen3-14b","Qwen/Qwen3-14B","qwen3-14b","qwen3-14b-instruct","qwen3-14b-instruct-reasoning","vercel_ai_gateway/alibaba/qwen-3-14b"],"hf_likes":386,"hf_downloads":3005499,"hf_downloads_all_time":14478982,"hf_trending_score":3,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"alibaba-qwen3-14b","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.06,"max_input_per_1m":0.35,"min_output_per_1m":0.2,"max_output_per_1m":1.4,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["deepinfra"],"provider_count":7},"providers":[],"regions":[],"region_info":{}}},{"id":"alibaba-qwen3-235b-a22b","name":"qwen3-235b-a22b","display_name":"Qwen3 235B A22B","description":"A large-scale Mixture-of-Experts LLM with 235B total parameters and 22B active parameters, designed for high-capability reasoning and instruction following.","creator":"alibaba","family":"qwen3_moe","tier":"","version":null,"type":"language","size_in_bn":235,"modalities":{"input":["text"],"output":["text"]},"context_window":262144,"max_output_tokens":131072,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2025-03-31","training_data_cutoff":null,"supported_reasoning_efforts":["default"],"tokenizer":"Qwen3","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":false,"reasoning":true,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2025-04-28","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":9,"ids":["accounts/fireworks/models/qwen3-235b-a22b","alibaba-qwen3-235b-a22b","deepinfra/Qwen/Qwen3-235B-A22B","fireworks_ai/accounts/fireworks/models/qwen3-235b-a22b","hyperbolic/Qwen/Qwen3-235B-A22B","nebius/Qwen/Qwen3-235B-A22B","novita/qwen/qwen3-235b-a22b-fp8","openrouter/qwen/qwen3-235b-a22b-2507","qwen.qwen3-235b-a22b-2507-v1:0","qwen/qwen3-235b-a22b","qwen/qwen3-235b-a22b-2507","qwen/qwen3-235b-a22b-fp8","qwen3-235b-a22b","qwen3-235b-a22b-instruct-2507-reasoning","qwen3-235b-a22b-instruct-reasoning"],"hf_likes":1091,"hf_downloads":589589,"hf_downloads_all_time":3957896,"hf_trending_score":3,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"alibaba-qwen3-235b-a22b","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.09,"max_input_per_1m":2,"min_output_per_1m":0.1,"max_output_per_1m":2.8,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["openrouter"],"provider_count":9},"providers":[],"regions":[],"region_info":{}}},{"id":"alibaba-qwen3-32b","name":"qwen3-32b","display_name":"Qwen3 32B","description":"A dense 32B-parameter LLM from the Qwen3 series with strong reasoning and tool-use capabilities, suitable for a wide range of language tasks.","creator":"alibaba","family":"qwen3","tier":"","version":null,"type":"language","size_in_bn":32,"modalities":{"input":["text"],"output":["text"]},"context_window":131072,"max_output_tokens":40960,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":"2025-03-31","training_data_cutoff":null,"supported_reasoning_efforts":["default"],"tokenizer":"Qwen3","capabilities":{"function_calling":true,"parallel_function_calling":true,"structured_outputs":true,"prompt_caching":false,"reasoning":true,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2025-04-28","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":15,"ids":["accounts/fireworks/models/qwen3-32b","alibaba-qwen3-32b","alibaba/qwen-3-32b","cerebras/qwen-3-32b","deepinfra/Qwen/Qwen3-32B","fireworks_ai/accounts/fireworks/models/qwen3-32b","gradient_ai/alibaba-qwen3-32b","groq/qwen/qwen3-32b","huggingface-reasoning-qwen3-32b","lambda_ai/qwen3-32b-fp8","nebius/Qwen/Qwen3-32B","novita/qwen/qwen3-32b-fp8","ovhcloud/Qwen3-32B","qwen.qwen3-32b-v1:0","qwen/qwen3-32b","Qwen/Qwen3-32B","qwen/qwen3-32b-fp8","qwen3-32b","qwen3-32b-instruct","qwen3-32b-instruct-reasoning","sambanova/Qwen3-32B","vercel_ai_gateway/alibaba/qwen-3-32b"],"hf_likes":685,"hf_downloads":2337650,"hf_downloads_all_time":26634596,"hf_trending_score":4,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"alibaba-qwen3-32b","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.05,"max_input_per_1m":0.9,"min_output_per_1m":0.1,"max_output_per_1m":0.9,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["lambda"],"provider_count":15},"providers":[],"regions":[],"region_info":{}}},{"id":"alibaba-qwen3-4b","name":"qwen3-4b","display_name":"Qwen3 4B","description":"A compact 4B-parameter dense LLM from the Qwen3 series supporting hybrid thinking and non-thinking modes for efficient on-device or low-latency deployment.","creator":"alibaba","family":"qwen3","tier":"","version":null,"type":"language","size_in_bn":4,"modalities":{"input":["text"],"output":["text"]},"context_window":131072,"max_output_tokens":20000,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":null,"training_data_cutoff":null,"supported_reasoning_efforts":["default"],"tokenizer":null,"capabilities":{"function_calling":true,"parallel_function_calling":false,"structured_outputs":false,"prompt_caching":false,"reasoning":true,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":null,"earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":4,"ids":["accounts/fireworks/models/qwen3-4b","alibaba-qwen3-4b","fireworks_ai/accounts/fireworks/models/qwen3-4b","huggingface-reasoning-qwen3-4b","nebius/Qwen/Qwen3-4B","novita/qwen/qwen3-4b-fp8","qwen/qwen3-4b-fp8","qwen3-4b"],"hf_likes":null,"hf_downloads":null,"hf_downloads_all_time":null,"hf_trending_score":null,"updated_at":"2026-06-13 08:02:30","pricing":{"model_id":"alibaba-qwen3-4b","currency":"USD","exchange_rate":1,"exchange_rate_date":"2026-06-13","ingestion_date":"2026-06-13","summary":{"currency":"USD","min_input_per_1m":0.03,"max_input_per_1m":0.2,"min_output_per_1m":0.03,"max_output_per_1m":0.42,"min_cache_read_per_1m":null,"min_cache_write_per_1m":null,"min_reasoning_per_1m":null,"cheapest_providers":["novita"],"provider_count":4},"providers":[],"regions":[],"region_info":{}}}],"pagination":{"page_size":50,"has_next":false,"next_token":null,"total_count":27},"meta":{"updated_at":"2026-06-13","request_id":"3d6be742-ccb0-43d3-876f-e2209288754e","execution_ms":9}}