Do ponto de vista econometrico é muito relevante saber como foi desenvolvido o programa. Por exemplo, no caso de um programa de saúde, se os hospitais forem escolhidos aleatoriamente, um simples teste de comparação de médias é suficiente. Entretanto, se o programa foi desenvolvido nas regiões mais pobres do país, obviamente não faz sentido comparar apenas as médias. Existe literatura relevante sobre esse assunto e a área que você está procurando se chama "Avaliação de Programas" (Program Evaluation).
Sugiro esse artigo para você começar o entendimento da área:
Desenvolvimentos recentes em avaliação de programas
Alguns livros muito interessantes sobre o assunto:
Dê uma olhada aqui.
Vale a pena também olhar alguns trabalhos brasileiros sobre o assunto (deve existir uma lista grande sobre o assunto):
Firpo, S. ; Pieri, R. G. . Avaliando os efeitos da introdução de computadores em escolas públicas brasileiras. Revista Brasileira de Inovação, v. 11, p. 153-190, 2012.
CARVALHO, Sandro Sacchet de ; FIRPO, S. ; GONZAGA, G. . Os Efeitos do Aumento da Licença Maternidade sobre Salário e Emprego da Mulher no Brasil. Pesquisa e Planejamento Econômico (Rio de Janeiro), v. ?, p. ?, 2006.