무척
외로워졌다. 왜인지는 모르겠다. 근데 갑자기 너무 외로워졌다.. 가장 큰 이유는 한국 온 이유로 정신이 없어서 약을 안 챙겨먹어서겠지.
- 삼청동
을 다녀왔다. 엄마가 외출하는 김에 따라서 구경하러 왔다. 엄마 친한 분이 인사동에서 전시를 하셔서 보러갔다왔는데 무척 좋았다. 아무 생각없이 다녀왔는데 무척 좋았음.. 바느질을 뜬 대상들이 가득한 그런 전시였는데 가장 추상적이면서 단순한 의미의 단위인 사각형들을 통해 구체적인 정서가 전달된다는 점이 재미있었다. 그리고 몇몇개의 형상들은 무척 슬프게 느껴졌다. 여쭤보니 연세가 많으신 분이 어머니를 그리면서 짠 형상이라는 이야기를 들었다.
어제가 아마 서울에서 올해 가장 날씨가 좋았던 날이지 싶다. 인사동을 거쳐서 삼청동 쪽으로 쭉 돌았는데 날씨가 정말 무척 좋았다. 장소에 대한 애착이 소속감을 가지지 않으려고 노력하는 요즘이지만 그 순간들이 너무 좋고 행복했어서 나도 모르게 한국에 남아버리고 싶다는 생각을 했다. 그러나 한편으론 요즘은, 어쩌면 한국을 이렇게 길게 오게 되는 일이 마지막이 될 것 같다는 예감도 든다. 나는 지금 미국 사람도 아니며 한국 사람도 아니다. 그냥 정처없이 흘러다닐 뿐이다.. 정신병자는 약이나 잘 챙겨 먹는 걸로.
- 연구
도 슬슬 다시 시작하고 있다.
정외과 교수와 하는 작업은 graph based sequential testing..이라고 이름을 지으면 좋을 것 같다. Meinshausen의 2008년 biometrika 페이퍼나 혹은 더 일반적으로는 Goeman and Solari의 2010년(맞나) Annals 페이퍼를 주 레퍼런스로 삼고 보고 있다.. 교수님이 미리 했었고 내가 지금 이론적으로 검증하려는 부분은 - 기존 graph based method들은 multiple (hierachical) p-value들을 처리할 때 adjustment를 주는데 그건 hierachical structure에 따라서.. 그러니까 graph의 더 아랫쪽 노드에 속한 p-value들에는 더 쎈 adjustment(더 conservative한 adjustment)를 주는 그런 식으로 strong FWER control을 하고 뭐 그런 아이디어라고 정리할 수 있다. 근데 정외과 교수가 해놨던 시뮬레이션은 어 근데 굳이 단순한 graph structure multiple testing에서는 adjustment를 주지 않아도 뭔가 꽤 control이 잘되는데? 이런 부분이었고.. 근데 그걸 이론적으로 보이는 부분에서 막혀있던 찰나(정외과 교수님은 수학적인 증명을 해본 적이 없으시다함) 내가 돕게 된 것이다. 그래서 지금 내가 시도하고 있는 graph based sequential testing procecdure를 일종의 conditional testing으로 이해해서 p-value들에 대한 global adjustment를 고려를 해도, 단순한 graph structure(binary 혹은 tenrary tree라든지) asymptotic sense에서는 원래 전체 p-value와 크게 차이없는 global adjustment를 줘도 된다는거고.. 또 한편으론 단순한 tree structure에서는 그런 asymptotical adjustment가 numerically finite sense exact solution과 큰 차이가 나지 않는다는 게 내가 주장하고 싶은 바임 헉헉..
라는 게 지난 주에 내가 떠올리고 계속 고민하고 있는 아이디어고 - 고민되는 게 있다면 이게 되게 단순한 아이디언데 왜 그동안 literature에선 안나왔을까? 내가 뭔가 놓치고 있는 게 있나? 하는 뭔가 global sense 찝찝합(어감이 재밌네) 이 계속 남아있으며 또 한편으론 이 결과가 너무 단순한 결과들에 대해서만 hold하는 것 같은 느낌도 있고, 다시 또 한편으론, 어디까지를 theorem으로 일반화하고 어디까지를 remark 내지는 practical suggestion으로 이야기해야할지 헷갈린다는거다.. 화요일 늦은 밤에 미팅이 있으니 그 때 여쭤볼 게 많다.
경제학과 교수님들과 하는 증명도 다시 감을 잡아나가고 있는 단곈데 - 이거 올해 안에 진짜 끝내버리고 싶은데 넘어야할 산들이 많음.. 남은 스텝이 (1) 증명 서너개 더 하기 (2) 데이터 및 시뮬레이션 작업하기 라고 할 수 있는데 한 사흘전부터는 그간 두 달 정도 고민하던 증명을 다시 보기 시작함. 별개로 휴식이라는 것의 장단점은 - 내가 기존에 고민하던 프레임워크로부터 잠시 낯설어질 수가 있어서 돌아오면 다시 원점에서부터 제대로 의심을 할 수 있다는 거고 하지만 단점은 증명에 대한 techinical한 감이 떨어진다는 부분에 있겠지. 여튼 한땀한땀 다시 보고 있는데.. 일단 Prokhorov의 1956년 논문에서 쓰인 general invariance priniciple도 쓰고 그 다음에 Siegel의 1986년 논문에서 쓰인 random index에 대한 invariance priniciple도 쓰고 그래야할 거 같다. 그러니까 그동안 고민했던 부분들을 다 한 데 모아놓고 한꺼번에 작업을 해야할 것 같다는 것..
별개로 Bertanha and Chung의 2022년 JASA 페이퍼의 Lemma F.3은.. -내가 지금 이해한 바가 맞다면- 엄청 강한 결과고 또 그래서 probability sense에서 limit theorem을 보여야하는 연구자들이 꼭 참고해봤으면 좋겠는 결과라고 생각을 하는데.. 그러니까 일종의 Lindeberg CLT의 일반화라고 생각을 한다. 서로 ‘달라붙어 있는’ random varaibles의 sequence가 있을 때, 한쪽에 대해선 CLT가 성립하고 한쪽은 ‘asmptotically negligible’할 때 결과적으로 전체에 대해 원하는 결과가 성립할 수 있다-에 대한 무척 general한 결과를 주는 게 이 렘마라고 느낀다. 어떤 점에서 그렇냐면, 이 렘마에서는 다른 한 쪽에 대한 measurable action이 asymptotically negligible하다면 전체에 대해 우리가 원하는 결과를, 그 한 쪽에 대한 conditional statement를 통해서도 충분히 보일 수 있다-라는 게 내가 이해한 이 렘마의 결과라서 그러함.. 여튼 관련 연구를 하시는 연구자가 있고 이 글을 읽고 있다면 한 번쯤 곱씹어볼만한 렘마라고 생각을 한다..