Аннотация:
В статье рассматриваются задача построения программы трассерных исследований в виде списка пар нагнетательных-добывающих скважин с использованием деревьев решений. Недостатком известных алгоритмов построения дерева решений является их склонность к переобучению, особенно в условиях малых объёмов выборки. В данной работе предлагается использовать оценки полного скользящего контроля и ожидаемой переобученности, разработанные в рамках комбинаторной теории переобучения, в качестве критериев разделения в узлах дерева решений для повышения обобщающей способности алгоритма. Подход апробирован на примере двух
месторождений Западной Сибири. Показано, что использование критериев приводит к статистически значимому улучшению метрик качества дерева решений и снижению переобучения и, таким образом, позволяет более точно выбирать скважины-кандидаты при планировании трассерных исследований с целью оценки наличия гидродинамической связи между нагнетательными и добывающими скважинами. Применение оценок комбинаторной теории переобучения для построения деревьев решений открывает возможности для повышения эффективности трассерных исследований в нефтегазовой отрасли.
Ключевые слова:комбинаторная теория переобучения, полный скользящий контроль, переобучение, дерево решений, обобщающая способность, пороговое правило, трассерное исследование, взаимовлияние скважин.