Differenz-von-Differenzen-Ansatz

Van Wikipedia, de gratis encyclopedie

Die gestrichelte Linie P1-Q zeigt an, wie sich die Werte hätten entwickeln müssen, wenn die beiden Gruppen denselben Einflussfaktoren ausgesetzt wären (Kontrollgruppe). Die Linie P1-P2 zeigt aber die tatsächliche gemessene Entwicklung. Die Differenz zwischen der Prognose und der tatsächlichen Entwicklung (Q-P2) zeigt die Effektstärke an.

Der Differenz-von-Differenzen-Ansatz, kurz DvD-Ansatz (englisch Difference-In-Differences approach, kurz DID, oder Double difference, kurz DD) ist ein in der Ökonometrie gebräuchlicher Ansatz, um einen kausalen Effekt festzustellen und dessen Stärke zu beschreiben.

Das zugrundeliegende Forschungsdesign arbeitet mit einer Behandlungs- und einer Kontrollgruppe. Es entspricht etwa einer Längsschnittstudie, das heißt, es müssen Daten derselben Untersuchungseinheiten über mindestens zwei Zeitpunkte vorliegen (siehe gepaarte Stichprobe, Paneldaten, Kohortenstudie) und zwar vor und nach einer Einflussnahme, z. B. einer Informationskampagne oder Politikmaßnahme. Da aber bei vielen ökonometrischen Fragestellungen eine zufällige Zuteilung (Randomisierung) der Versuchsteilnehmer auf eine Behandlungs- oder Kontrollgruppe nicht möglich ist, behandelt man eine bereits definierte Personengruppe (z. B. einen Bezirk oder eine Stadt) als die Behandlungs- und eine andere Gruppe als die Kontrollgruppe (z. B. Nachbar-Bezirk). Durch die fehlende Randomisierung unterscheidet sich das Forschungsdesign von einem psychologischen Experiment und entspricht eher einem Quasi-Experiment.

Eine frühe Anwendung der Methode findet sich bei Feldstein (1995).[1] Allerdings ist die grundlegende Idee des DvD-Ansatz wahrscheinlich so alt wie die der Instrumentvariable. Es gibt eine Referenz von Kennan (1995) auf einen Bericht aus dem Jahre 1915, der eine Art DvD-Ansatz gebraucht, um die Effekte von Mindestlöhnen zu untersuchen.[2] Ein ähnliches Verfahren zur Entdeckung von Kausaleffekten ist die Regressions-Diskontinuitäts-Analyse.

Ansatz[Bearbeiten | Quelltext bearbeiten]

Der Ansatz basiert im Prinzip auf der Regressionsanalyse, deren Annahmen auch für DvD vorausgesetzt werden. Zusätzlich gibt es die Trend-Annahme, dass beide Beobachtungsgruppen sich gleich verhalten oder entwickelt hätten, ohne eine entsprechende Intervention oder ein Programm.[3] Um die Annahme paralleler Trends zu testen, gibt es verschiedene Möglichkeiten. Liegen Daten aus frühen Perioden vor der Intervention vor, kann ein Placebo-DvD-Effekt untersucht werden (es sollte sich kein Effekt zeigen). Eine andere Variante sieht den Gebrauch einer weiteren Kontrollgruppe vor (der Effekt sollte sich weiterhin zeigen).

Der DvD-Ansatz beschreibt den Zusammenhang zwischen den Gruppen über die Zeit durch die folgende Gleichung:[4]

,

hierbei bezeichnet:

  • die Antwortvariable für Individuum oder Beobachtung zum Zeitpunkt
  • die Regressionskonstante
  • einen unbekannten Regressionsparameter, der den Effekt der für die Behandlungsgruppe spezifisch ist und der die durchschnittlichen dauerhaften Unterschiede zwischen Behandlungs- und Kontrollgruppe berücksichtigt
  • erfasst die möglichen Unterschiede zwischen Behandlungs- und Kontrollgruppe vor der Intervention. Es handelt sich also um eine Dummy-Variable für die stattfindende Intervention
  • ist der Zeit-Trend, der der Kontroll- und Behandlungsgruppe gemeinsam ist
  • ist eine Zeitabhängige Dummy-Variable, die die aggregierten Faktoren berücksichtigt, die sogar in der Abwesenheit einer Intervention eine Änderung in der Antwortvariablen hervorrufen würden
  • ist der zu schätzende Parameter des Interesses (der „wahre Behandlungseffekt“), der ein Koeffizient des Interaktionsterms ist
  • ist eine Dummy-Variable für die Beobachtungen, die in der Behandlungsgruppe und zugleich in der Post-Intervention-Periode liegen
  • eine additive unbeobachtbare Störgröße

Das Ziel der Differenz-von-Differenzen-Schätzung ist es einen Schätzer zu finden, der gewisse statistische Gütekriterien erfüllt. Der interessierende Effekt einer Intervention (z. B. einer Politikmaßnahme) findet sich als Interaktion der Dummy-Variablen (Differenz-von-Differenzen-Schätzer):

,

wobei der Querstrich jeweils das arithmetische Mittel einer Variablen beschreibt, der Index für den jeweiligen Zeitpunkt und das hochgestellte und für die Gruppenzugehörigkeit (Behandlungsgruppe (englisch Treatment Group) bzw. Kontrollgruppe (englisch Control Group)) steht. Der geschätzte Effekt des Interesses (Delta für Differenz) beschreibt dann den geschätzten durchschnittlichen kausalen Effekt. Da er sich durch die Differenz von Differenzen errechnet wird er auch Differenz-von-Differenzen-Schätzer genannt.

Anwendungsbeispiele[Bearbeiten | Quelltext bearbeiten]

Gedankenbeispiel[Bearbeiten | Quelltext bearbeiten]

In einer Stadt A gebe es 5.675 und in Stadt B 3.113 Arbeitslose. Die Regierung von B führt ein Projekt zur beruflichen Weiterbildung von Arbeitslosen durch. Bei Projektende weist die Stadt B nun 3.201 Arbeitslose auf – die Arbeitslosigkeit ist wegen einer Rezession trotz des Projektes angestiegen. Die Zunahme in B beträgt 88 Personen (entspricht 2,83 %). Unter der Annahme, dass sich die Arbeitslosenzahl von Stadt A innerhalb der gleichen Zeit gleich entwickelt hätte, falls dort ein gleichartiges Weiterbildungsprojekt unternommen worden wäre, müssten demnach dort 5.675 × 102,83 / 100 = 5.836 Arbeitslose leben. Tatsächlich leben aber nun in der Stadt A zum zweiten Zeitpunkt 5.851 Arbeitslose (Zunahme 3,1 %).

Die Differenz der Arbeitslosenzahlen in jeder Stadt (Vorher-Nachher-Vergleich bei beiden Städten getrennt) führt zur Differenz der Differenzen (Differenz der zwei Vorher-Nachher-Vergleiche). Diese erlaubt es, eine Aussage über die Effektivität der Weiterbildungsmaßnahme zu treffen. Die Schlussfolgerung wäre, dass 2,83 % − 3,1 % = -0,27 %, also dass die Arbeitslosenquote durch die Weiterbildungsmaßnahme in Stadt B verringert wurde.

Operation Barga[Bearbeiten | Quelltext bearbeiten]

Operation Barga war eine Landreform in Westbengalen, einem indischen Bundesstaat (Start 1978). Der Nachbarstaat Bangladesch hat viele Gemeinsamkeiten bezüglich der Bevölkerung, Kultur, Klima und anderer Aspekte. Vor Operation Barga war das Produktivitätswachstum im Agrarsektor in beiden Regionen etwa gleich. Hauptsächlich wurde Reis produziert. Über einen Zeitraum von etwa 1970 bis 1990 wurde die Reisernte in beiden Ländern gemessen (Paneldaten). Um zu zeigen, dass die politische Maßnahme dieser Landreform einen nachweisbaren Effekt auf die Reiserträge hatte, kann eine Differenz-von-Differenzen-Schätzung durchgeführt werden.[5]

Dabei wird die Veränderung der Erträge (vor und nach Operation Barga) in den Distrikten von Westbengalen mit den entsprechenden Änderungen der Kontrolldistrikte in Bangladesch verglichen.

Mindestlohn in New Jersey[Bearbeiten | Quelltext bearbeiten]

Die Untersuchung des Effekts eines Mindestlohns auf die Arbeitslosigkeit ist eine wichtige Frage der Arbeitsökonomik. Im April 1992 wurde der Mindestlohn in New Jersey von 4,25 Dollar auf 5,05 Dollar angehoben. David Card und Alan B. Krueger sammelten Daten aus Fast Food-Restaurants im Februar und November des Jahres 1992 (also vor und nach der Reform) und ähnliche Daten in Pennsylvania, einem Nachbarstaat. Der Mindestlohn dort blieb in dieser Zeit bei 4,25 Dollar.[6]

Die Autoren konnten in diesem Fall keinen Hinweis finden, dass die Erhöhung des Mindestlohnes zu weniger Beschäftigung geführt hätte.[7]

Erweiterung[Bearbeiten | Quelltext bearbeiten]

Es gibt auch Modelle die mit einer dreifachen Differenz arbeiten. Die entsprechende Verallgemeinerung wird Differenzen-von-Differenzen-von-Differenzen-Ansatz, oder Dreifachen-Differenzen-Ansatz (englisch difference in differences in differences, kurz DDD oder kurz triple difference, kurz TD) genannt. Ein entsprechendes Beispiel würde neben den Zeitpunkten und einer Gruppenzugehörigkeit (z. B. Leben in einer Region und einer Nachbarregion) eine weitere Unterschiedsvariable der Untersuchungsobjekte annehmen, etwa eine persönliche Charakteristik der Teilnehmer (z. B. nach ihrer Qualifikation).[8]

Die Methode kann theoretisch beliebig ausgedehnt werden. Der Zusatznutzen ist allerdings fraglich. Im Falle von einer Behandlungsgruppe und zwei Kontrollgruppen, würde ein DvD-Schätzer, der Null ist, nur die Teststärke reduzieren und den Standardfehler vergrößern. Wäre er nicht Null, ergäben sich Fragen nach der internen Validität des ursprünglichen DvD-Schätzers.[9]

Eine Beispielarbeit die sowohl den DDD-Ansatz als auch die Instrumentvariablenschätzung nutzt, findet sich bei Tsoutsoura, 2010.[10] Diese Arbeit untersucht den Effekt der Erbschaftssteuer auf die Firmennachfolge und Investitionsentscheidungen.

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

  • Alberto Abadie: Semiparametric difference-in-differences estimators. In: The Review of Economic Studies. 72.1, 2005, S. 1–19, doi:10.1111/0034-6527.00321.
  • Franziska Kugler, Guido Schwerdt, Ludger Wößmann: Ökonometrische Methoden zur Evaluierung kausaler Effekte der Wirtschaftspolitik. In: Perspektiven der Wirtschaftspolitik. 15(2), 2014, S. 105–132, doi:10.1515/pwp-2014-0013.
  • Vern Henderson, Jacques-François Thisse (Hrsg.): Handbook of regional and urban economics: cities and geography. Vol. 4. Elsevier, 2004, ISBN 0-444-50967-4, S. 30–37.

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Hannes Schellhorn: Effizienzeffekte der Einkommensteuer bei Steuervermeidung. Springer-Verlag, 2005, ISBN 3-8244-0793-0, doi:10.1007/978-3-322-81169-1, S. 5.
  2. Joshua D. Angrist, Jörn-Steffen Pischke: Mostly harmless econometrics: An empiricist's companion. Princeton university press, 2008, ISBN 978-1-282-60809-2, S. 170.
  3. Dominic J. Brewer, Lawrence O. Picus (Hrsg.): Encyclopedia of Education Economics and Finance. SAGE Publications, 2014, ISBN 978-1-4833-4659-5, S. 206ff.
  4. Jeffrey Wooldridge: Introductory econometrics: A modern approach. Nelson Education, 2013, ISBN 978-1-111-53104-1, S. 410ff.
  5. Abhijit V. Banerjee, Paul J. Gertler, Maitreesh Ghatak: Empowerment and efficiency: tenancy reform in West Bengal. In: Journal of Political Economy. 110.2, 2002, S. 239–280, doi:10.1086/338744 JSTOR:338744.
  6. Joshua D. Angrist, Jörn-Steffen Pischke: Mostly harmless econometrics: An empiricist's companion. Princeton university press, 2009, ISBN 978-0-691-12035-5, S. 169.
  7. D. Card, A. B. Krueger: Minimum Wages and Employment: A Case Study of the Fast-Food Industry in New Jersey and Pennsylvania. In: The American Economic Review. 84(4), 1994, S. 772–793. doi:10.3386/w4509 JSTOR:2118030
  8. Myoung-Jae Lee: Micro-econometrics for policy, program, and treatment effects. Oxford University Press, Oxford 2005, ISBN 0-19-926768-5, S. 111ff.
  9. George M. Constantinides, Milton Harris, René M. Stulz (Hrsg.): Handbook of the Economics of Finance. Vol. 1A: Corporate finance. Elsevier, 2003, ISBN 0-444-51362-0, S. 530.
  10. Margarita Tsoutsoura: The effect of succession taxes on family firm investment: Evidence from a natural experiment. In: The Journal of Finance. 70.2, 2015, S. 649–688, doi:10.1111/jofi.12224.