KIKIneAhnung
Alle Tipps
Tool-Update2026-06-09

Google Gemini 3.5 Pro: Deep Think und 2 Millionen Token Kontext -- Googles stärkstes KI-Modell startet

Google steht kurz davor, sein bisher stärkstes KI-Modell für alle verfügbar zu machen: Gemini 3.5 Pro. Angekündigt auf der Google I/O am 19. Mai 2026, zielt das Modell auf die allgemeine Verfügbarkeit im Juni 2026. Die beiden Highlights: ein Kontextfenster von 2 Millionen Token und der neue Deep-Think-Modus für komplexes Schlussfolgern.

Was ist Gemini 3.5 Pro?

Gemini 3.5 Pro ist Googles neues Spitzenmodell -- es ersetzt die bisherige Ultra-Stufe und übernimmt die anspruchsvollsten Aufgaben: tiefes Reasoning, multimodale Analyse (Text, Bilder, Code gleichzeitig) und Aufgaben, die extrem viel Kontext erfordern. In Googles eigener Modellreihe positioniert sich Pro damit über Flash (dem schnellen, günstigen Alltagsmodell) als die Wahl für komplexe Herausforderungen.

Deep Think: Wenn die KI mitdenkt statt nur antwortet

Der Deep-Think-Modus ist Googles Antwort auf den Trend zu 'denkenden' KI-Modellen. Statt sofort eine Antwort zu generieren, nimmt sich das Modell im Deep-Think-Modus bewusst mehr Zeit, um ein Problem Schritt für Schritt durchzudenken -- ähnlich wie du selbst bei einer schwierigen Aufgabe erst nachdenkst, bevor du antwortest.

Wo Deep Think einen echten Unterschied macht:

- Mathematische Probleme mit mehreren Schritten: Textaufgaben mit Einheitenumrechnungen, verschachtelten Bedingungen oder Variablen, bei denen einfache Modelle Fehler machen
- Tabellarisches Reasoning: Daten in Tabellen analysieren und Schlüsse ziehen -- 88 % Genauigkeit vs. 69 % ohne Deep Think in internen Benchmarks

- Dokumentenübergreifende Synthese: Informationen aus mehreren Quellen zusammenführen und vergleichen -- 90 % Relevanz vs. 78 % ohne Deep Think

- API-Planung und technische Spezifikationen: Komplexe Systemarchitekturen durchdenken -- 81 % vs. 65 % ohne Deep Think

- Strategische Analyse: Szenarien durchspielen, Geschäftsentscheidungen abwägen, Risiken bewerten

Wann du Deep Think NICHT brauchst: Für einfache Faktenfragen, schnelle Zusammenfassungen oder kreatives Brainstorming ist der normale Modus besser -- Deep Think braucht deutlich länger und bringt bei einfachen Aufgaben keinen Vorteil.

2 Millionen Token Kontext: Was bedeutet das praktisch?

Das Kontextfenster bestimmt, wie viel Information das Modell gleichzeitig im 'Arbeitsgedächtnis' halten kann. 2 Millionen Token entsprechen grob:

- Etwa 1.500 Seiten Text -- ein komplettes Fachbuch oder eine umfangreiche Projektdokumentation
- Mehrere Stunden Transkript -- eine ganze Konferenz oder Workshopreihe

- Eine komplette Codebasis -- mittlere bis große Softwareprojekte vollständig analysieren

- Dutzende Dokumente gleichzeitig -- Verträge, Berichte, E-Mail-Ketten parallel vergleichen

Konkrete Anwendungsbeispiele:

- 'Hier sind 20 Kundenberichte aus dem letzten Quartal. Finde übergreifende Muster, identifiziere die drei häufigsten Beschwerden und erstelle einen Aktionsplan.'
- 'Analysiere diese drei Verträge (je 50 Seiten) und zeige mir alle Unterschiede in den Haftungsklauseln.'

- 'Lies diese komplette Projektdokumentation und beantworte meine Fragen dazu, ohne dass ich dir einzelne Abschnitte zeigen muss.'

- 'Hier ist der Code unserer Anwendung. Finde Sicherheitslücken und erkläre mir, wie die Komponenten zusammenhängen.'

Verfügbarkeit und Kosten:

- Gemini-App (Konsumenten): Verfügbar über das Pro-Abo (20 USD/Monat) und das Ultra-Abo (250 USD/Monat). Deep Think ist exklusiv für Ultra-Abonnenten
- API-Zugang (Entwickler): Erwartet werden ca. 15 USD pro Million Input-Tokens und 60 USD pro Million Output-Tokens -- vergleichbar mit den Spitzenmodellen von Anthropic und OpenAI

- Gemini 3.5 Flash: Das günstigere Schwestermodell ist bereits verfügbar und seit dem 9. Juni 2026 als Standard für alle Gemini-Enterprise-Nutzer aktiviert

- Allgemeine Verfügbarkeit: Im Laufe des Juni 2026 -- zunächst über die API und die Gemini-App

- Regionen: Global, US und EU -- keine bekannten Einschränkungen für Deutschland

Gemini 3.5 Pro vs. Flash: Welches Modell wofür?

| | Flash | Pro |
|---|---|---|

| Stärke | Schnell und günstig | Tiefes Reasoning und langer Kontext |

| Kontextfenster | 1 Million Token | 2 Millionen Token |

| Deep Think | Nein | Ja (Ultra-Abo) |

| Ideal für | Alltagsaufgaben, Chat, Zusammenfassungen | Analyse, Forschung, komplexe Aufgaben |

| Kosten (API) | ~1,50 USD / 1M Input-Token | ~15 USD / 1M Input-Token |

Faustregel: Starte mit Flash. Wenn die Ergebnisse nicht tief genug sind oder du sehr viel Kontext brauchst, wechsle zu Pro.

Datenschutz-Hinweis für deutsche Nutzer:

Google verarbeitet Gemini-Anfragen standardmäßig auf globalen Servern. Für Workspace-Kunden gelten die EU-Datenverarbeitungszusagen von Google. Für private Nutzer gilt: Gespräche im Gemini Pro- und Ultra-Abo werden laut Google nicht zum Trainieren neuer Modelle verwendet. Trotzdem solltest du keine hochsensiblen Unternehmensdaten in die Consumer-App laden -- nutze dafür die Workspace-Version oder die API mit entsprechenden Datenverarbeitungsverträgen.

Praxis-Tipp: Deep Think gezielt einsetzen

1. Starte deine Aufgabe im normalen Modus
2. Wenn die Antwort oberflächlich wirkt oder logische Fehler enthält, aktiviere Deep Think

3. Formuliere deine Frage möglichst präzise -- Deep Think profitiert von klaren, strukturierten Aufgaben

4. Gib dem Modell alle relevanten Informationen auf einmal (nutze das große Kontextfenster), statt häppchenweise nachzuliefern

5. Für Vergleiche und Analysen: Lade alle Dokumente gleichzeitig hoch, statt nacheinander zu fragen

Was bedeutet das für dich?

Mit Gemini 3.5 Pro bekommt jeder Zugang zu einem KI-Modell, das bisher nur in der teuersten Stufe verfügbar war. Das 2-Millionen-Token-Fenster löst ein echtes Problem: Du musst Dokumente nicht mehr in Häppchen aufteilen oder der KI erklären, was sie vorher gelesen hat. Und Deep Think schließt die Lücke bei Aufgaben, wo bisherige Modelle zu schnell und zu oberflächlich geantwortet haben. Das ist kein marginales Upgrade -- es verändert, welche Art von Aufgaben du einer KI zutrauen kannst.

Quellen: techtimes.com/articles/317919/20260606/google-gemini-35-pro-nears-june-launch-2-million-token-context-deep-think-reasoning.htm, blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro, deepmind.google/models/gemini

Tool: Google Gemini 3.5 Pro

ToolsGoogleProduktivitätDatenanalyseWorkflow
Teilen: