OpenAI ने एक बड़ा कदम उठाया है। GPT-5.4 आज से ChatGPT (GPT-5.4 Thinking के नाम से), API और Codex में उपलब्ध है। यह OpenAI का अब तक का सबसे शक्तिशाली और कुशल फ्रंटियर मॉडल है, जो प्रोफेशनल काम के लिए बनाया गया है। GPT-5.4 Pro वर्ज़न भी उपलब्ध है — उन लोगों के लिए जो सबसे जटिल कार्यों पर अधिकतम प्रदर्शन चाहते हैं।
GPT-5.4 वास्तव में क्या बदलता है
GPT-5.4 OpenAI की हालिया सभी प्रगतियों को एक मॉडल में एकीकृत करता है। इसमें GPT-5.3-Codex की कोडिंग क्षमताएँ शामिल हैं, साथ ही टूल्स, सॉफ़्टवेयर वातावरण और प्रोफेशनल कार्यों — जैसे स्प्रेडशीट, प्रेज़ेंटेशन और डॉक्यूमेंट — में काफ़ी सुधार हुआ है।
परिणाम: एक ऐसा मॉडल जो जटिल काम को सटीकता और दक्षता से पूरा करता है, कम बार-बार पूछताछ के साथ। अब सही स्प्रेडशीट फ़ॉर्मेट या सही लेआउट पाने के लिए 3 बार रिक्वेस्ट भेजने की ज़रूरत नहीं।
10 लाख टोकन: अब मेमोरी काफ़ी है
GPT-5.4 10 लाख (1 मिलियन) टोकन कॉन्टेक्स्ट सपोर्ट करता है — GPT-5.2 के 4 लाख टोकन से दोगुने से भी ज़्यादा। व्यावहारिक रूप से, यह मॉडल पूरे कोडबेस, संपूर्ण डॉक्यूमेंटेशन लाइब्रेरी या लंबी बातचीत को बिना संदर्भ खोए प्रोसेस कर सकता है।
इस विस्तारित मेमोरी के साथ बेहतर रिटेंशन भी आता है: GPT-5.4 लंबे सेशन में आपके निर्देशों और संदर्भ को याद रखता है। 20 मैसेज के बाद निर्देश भूल जाना अब अतीत की बात है। Codex उपयोगकर्ताओं के लिए यह एक बड़ा बदलाव है — मॉडल लंबी अनुक्रमों में योजना बना सकता है, कार्य कर सकता है और जाँच कर सकता है।
एक्सट्रीम रीज़निंग: xhigh मोड
GPT-5.4 xhigh नामक एक नया रीज़निंग स्तर पेश करता है। यह मोड उत्तर देने से पहले सोचने के लिए काफ़ी अधिक संसाधन आवंटित करता है — एक स्लो कंप्यूट रणनीति जो विशेषज्ञ विषयों, जटिल विश्लेषणों और मल्टी-स्टेप कार्यों के लिए निर्णायक साबित होती है।
ChatGPT में, GPT-5.4 Thinking अब पहले से एक विचार योजना प्रस्तुत कर सकता है, जिससे आप काम करते समय उसकी दिशा को समायोजित कर सकते हैं। बातचीत दोबारा शुरू किए बिना आपकी अपेक्षाओं के अनुरूप अंतिम परिणाम मिलता है।
Computer Use: GPT-5.4 आपके कंप्यूटर को नियंत्रित करता है
यह सबसे प्रभावशाली नई सुविधा है। GPT-5.4 OpenAI का पहला जनरलिस्ट मॉडल है जिसमें नेटिव कंप्यूटर यूज़ क्षमताएँ हैं। यह वेब ब्राउज़ कर सकता है, फ़ॉर्म भर सकता है, ईमेल भेज सकता है, इंटरफ़ेस को संचालित कर सकता है — यह सब स्क्रीनशॉट पढ़कर और कीबोर्ड/माउस कमांड भेजकर करता है।
OSWorld-Verified पर, जो डेस्कटॉप वातावरण में नेविगेट करने की क्षमता मापता है, GPT-5.4 ने 75.0% सफलता दर हासिल की — GPT-5.2 के 47.3% को ध्वस्त करते हुए और मानव प्रदर्शन 72.4% को पार करते हुए। यानी स्क्रीनशॉट के ज़रिए कंप्यूटर चलाने में यह मॉडल औसत इंसान से बेहतर है।
| बेंचमार्क | GPT-5.4 | GPT-5.2 | मानव |
|---|---|---|---|
| OSWorld-Verified (डेस्कटॉप) | 75.0% | 47.3% | 72.4% |
| WebArena-Verified (ब्राउज़र) | 67.3% | 65.4% | - |
| Online-Mind2Web (ब्राउज़र) | 92.8% | - | - |
GPT-5.4 का Computer Use प्रदर्शन
प्रोफेशनल काम: स्प्रेडशीट, प्रेज़ेंटेशन, डॉक्यूमेंट
OpenAI ने GPT-5.4 की स्प्रेडशीट, प्रेज़ेंटेशन और डॉक्यूमेंट बनाने और एडिट करने की क्षमताओं पर विशेष ज़ोर दिया है। एक आंतरिक स्प्रेडशीट मॉडलिंग बेंचमार्क (इन्वेस्टमेंट बैंकिंग में जूनियर एनालिस्ट स्तर) पर GPT-5.4 ने 87.3% स्कोर किया — GPT-5.2 के 68.4% की तुलना में।
प्रेज़ेंटेशन के लिए, मानव मूल्यांकनकर्ताओं ने 68% मामलों में GPT-5.4 की स्लाइड्स को GPT-5.2 से बेहतर माना — बेहतर सौंदर्य, अधिक विज़ुअल विविधता और इमेज जेनरेशन के अधिक प्रभावी उपयोग के कारण।
GDPval पर, जो 44 पेशों में वास्तविक कार्य पर एजेंट क्षमताओं का परीक्षण करता है, GPT-5.4 ने एक नया रिकॉर्ड बनाया: यह 83% तुलनाओं में क्षेत्र के पेशेवरों के बराबर या उनसे बेहतर है — GPT-5.2 के 70.9% की तुलना में।
कम हैलुसिनेशन, ज़्यादा सटीकता
GPT-5.4 OpenAI का सबसे तथ्यात्मक मॉडल है। उन प्रश्नों पर जहाँ उपयोगकर्ताओं ने पहले तथ्यात्मक त्रुटियाँ बताई थीं, GPT-5.4 के व्यक्तिगत दावे GPT-5.2 की तुलना में 33% कम ग़लत हैं और इसकी पूर्ण प्रतिक्रियाओं में 18% कम त्रुटियाँ होने की संभावना है।
कोडिंग: GPT-5.3-Codex की ताकत का विलय
GPT-5.4 GPT-5.3-Codex की कोडिंग क्षमताओं को अपनी रीज़निंग और कंप्यूटर यूज़ ताकत के साथ जोड़ता है। यह SWE-Bench Pro पर GPT-5.3-Codex के बराबर या बेहतर प्रदर्शन करता है (57.7% बनाम 56.8%), साथ ही सभी रीज़निंग स्तरों पर तेज़ भी है।
Codex में /fast मोड GPT-5.4 के साथ 1.5 गुना तेज़ टोकन जेनरेशन प्रदान करता है। वही मॉडल, वही बुद्धिमत्ता — बस तेज़। OpenAI ने यह भी नोट किया कि मॉडल जटिल फ़्रंटएंड कार्यों पर उत्कृष्ट है, जिसमें उनके पहले के किसी भी मॉडल से बेहतर विज़ुअल परिणाम मिलते हैं।
Tool Search: हज़ारों टूल्स को स्मार्ट तरीके से प्रबंधित करें
GPT-5.4 Tool Search पेश करता है — एजेंटिक वर्कफ़्लो के लिए एक गेम-चेंजर सुविधा। पहले, सभी टूल डेफ़िनिशन प्रॉम्प्ट में शामिल होती थीं, जो हर रिक्वेस्ट में दसियों हज़ार टोकन जोड़ सकती थीं। Tool Search के साथ, मॉडल उपलब्ध टूल्स की एक हल्की सूची प्राप्त करता है और पूर्ण डेफ़िनिशन केवल ज़रूरत पड़ने पर लोड करता है।
36 MCP सर्वर के साथ MCP Atlas बेंचमार्क पर परिणाम: समान सटीकता के साथ 47% कम टोकन। दसियों हज़ार टोकन की टूल डेफ़िनिशन वाले MCP सर्वर के लिए, ये बचत बहुत बड़ी है।
विस्तृत बेंचमार्क
| बेंचमार्क | GPT-5.4 | GPT-5.4 Pro | GPT-5.2 |
|---|---|---|---|
| GDPval (प्रोफेशनल) | 83.0% | 82.0% | 70.9% |
| SWE-Bench Pro (कोडिंग) | 57.7% | - | 55.6% |
| OSWorld (कंप्यूटर यूज़) | 75.0% | - | 47.3% |
| BrowseComp (वेब सर्च) | 82.7% | 89.3% | 65.8% |
| Toolathlon (टूल्स) | 54.6% | - | 45.7% |
| ARC-AGI-2 (रीज़निंग) | 73.3% | 83.3% | 52.9% |
| GPQA Diamond (साइंस) | 92.8% | 94.4% | 92.4% |
| Humanity's Last Exam | 52.1% | 58.7% | 45.5% |
प्रमुख बेंचमार्क पर GPT-5.4 बनाम GPT-5.2 का प्रदर्शन
कीमत और उपलब्धता
GPT-5.4 Thinking आज से ChatGPT Plus, Team और Pro सब्सक्राइबर्स के लिए उपलब्ध है, GPT-5.2 Thinking की जगह। GPT-5.2 Legacy Models सेक्शन में 3 महीने तक उपलब्ध रहेगा और 5 जून 2026 को रिटायर होगा। GPT-5.4 Pro केवल Pro और Enterprise प्लान के लिए है।
| API मॉडल | इनपुट कीमत | कैश्ड इनपुट | आउटपुट कीमत |
|---|---|---|---|
| gpt-5.2 | $1.75 / M टोकन | $0.175 / M टोकन | $14 / M टोकन |
| gpt-5.4 | $2.50 / M टोकन | $0.25 / M टोकन | $15 / M टोकन |
| gpt-5.4-pro | $30 / M टोकन | - | $180 / M टोकन |
GPT-5.4 API मूल्य निर्धारण
GPT-5.4 प्रति टोकन GPT-5.2 से महँगा है, लेकिन इसकी बेहतर टोकन दक्षता कई कार्यों के लिए कुल टोकन खपत कम करती है। Batch और Flex दरें आधी कीमत पर उपलब्ध हैं।
ChatGPT उपयोगकर्ताओं के लिए क्या बदलता है
दैनिक ChatGPT उपयोगकर्ता के लिए, GPT-5.4 तीन बड़े सुधार लाता है: अधिक सटीक उत्तर और कम हैलुसिनेशन, लंबी बातचीत में बेहतर संदर्भ ट्रैकिंग, और काम करते समय मॉडल की विचार योजना को देखने और समायोजित करने की क्षमता।
डेवलपर्स और पेशेवरों के लिए, कंप्यूटर यूज़ और Tool Search गेम-चेंजर हैं। ऐसे एजेंट बनाने की क्षमता जो वेब ब्राउज़ करें, फ़ॉर्म भरें और जटिल कार्यों को स्वायत्त रूप से पूरा करें — ये संभावनाएँ पहले केवल कस्टम समाधानों तक सीमित थीं।
मॉडल्स की दौड़ धीमी नहीं हो रही
GPT-5.4 के साथ, OpenAI सीधे प्रतिस्पर्धा के दबाव का जवाब दे रहा है। Anthropic का Claude रीज़निंग और कोडिंग में आगे बढ़ रहा है, Google का Gemini मल्टीमोडल और लॉन्ग कॉन्टेक्स्ट पर ज़ोर दे रहा है, और DeepSeek दक्षता में हैरान कर रहा है। यह लॉन्च स्पष्ट रूप से हाल के महीनों में खोई ज़मीन वापस पाने का प्रयास है।
असली सवाल यह है कि यह बढ़त कितनी टिकाऊ है। GPT-5.4 आज प्रभावशाली है, लेकिन एक ऐसे बाज़ार में जहाँ हर हफ़्ते नया फ्रंटियर मॉडल आता है, ये बेंचमार्क कब तक शीर्ष पर रहेंगे?
AI समाचार से जुड़े रहें
AI मॉडल्स, लॉन्च और महत्वपूर्ण इनोवेशन पर नवीनतम अपडेट पाएँ।
कोई स्पैम नहीं। 1 क्लिक में सदस्यता रद्द करें।





