というNBER論文が上がっている。原題は「Stacked Difference-in-Differences」で、著者はCoady Wing(インディアナ大)、Seth M. Freedman(同)、Alex Hollingsworth(オハイオ州立大)。
This paper introduces the concept of a "trimmed aggregate ATT," which is a weighted average of a set of group-time average treatment effect on the treated (ATT) parameters identified in a staggered adoption difference-in-differences (DID) design. The set of identified group-time ATTs that contribute to the aggregate is trimmed to achieve compositional balance across an event window, ensuring that comparisons of the aggregate parameter over event time reveal dynamic treatment effects and differential pre-trends rather than compositional changes. Taking the trimmed aggregate ATT as a target parameter, we investigate the performance of stacked DID estimators. We show that the most basic stacked estimator does not identify the target aggregate or any other average causal effect because it applies different implicit weights to treatment and control trends. The bias can be eliminated using corrective sample weights. We present a weighted stacked DID estimator, and show that it correctly identifies the target aggregate, providing justification for using the estimator in applied work.
ググって見つけたこちらの日本語資料によると、2方向固定効果やイベントスタディでの差の差分析では、処置効果に不均一性があり、それが処置タイミングと相関していたら、仮に平行トレンドの仮定*1が成立していたとしても、偏りが生じてしまう、とのこと。その解決法として提案されたのがStacked Regression approach(積み重ね回帰手法)とのことだが、それについても実は荷重(ウエート)の修正が必要、というのがこの論文の主旨のようである。
同じくググって見つけた著者の一人(Coady Wing)の2年前のスライド資料では、stacked手法について以下のように説明されている。
What is a stacked DID or stacked event study?
A stacked DID or stacked event study is a way to analyze data from a staggered adoption design.
The idea originally appears in two applied papers:
• Cengiz, Doruk, Arindrajit Dube, Attila Lindner, and Ben Zipperer. "The effect of minimum wages on low-wage jobs." The Quarterly Journal of Economics 134, no. 3 (2019): 1405-1454.
• Deshpande, Manasi, and Yue Li. "Who is screened out? Application costs and the targeting of disability programs." American Economic Journal: Economic Policy 11, no. 4 (2019): 213-48.
The scheme is not perfect. It doesn’t provide the perfect way to “weight and sum” event specific treatment effects.
But it ensures that you don’t have any problematic comparisons and so is robust to the biases those comparisons create
時差を適用した手法(staggered adoption design)の例としてスライドでは以下を挙げている。
この手法で得られたデータに2方向固定効果の回帰を適用すると、その係数は2x2DID(2群×2期間のDID)の全てのペアの加重平均になっていることがGoodman-Bacon(2021) *4によって示されたという。ただ、そうした奇妙な加重平均になること自体が大きな問題というわけではない、とのことである。大きな問題なのは、既に処置された群を対照群として使うため、処置効果が時間とともに変動すると偏りが生じてしまうこと、との由*5*6。
*6:処置効果の時間変動としてスライドでは、「浸透効果(Phase in effects)」と「時間軸と処置効果の相互作用(Calendar Period x Treatment Effect Interactions)」を挙げている。前者の例としては、新税に関する知識が普及するのに時間が掛かるため、人々の消費行動や生産行動が変わるのが遅れることや、マリファナを1年で合法化しても販売店が開くのに数年掛かることを挙げている。後者の例としては、失業保険給付の拡充が不況時には労働供給に無視できる効果しか与えないが、好況時には大きな効果を与えることを挙げている。なお、前掲の日本語資料では、規制緩和が効果の高い地域から実施されることを例に挙げている。