The Difference Between Knowing The Path And Walking The Path

작장인 박사 학위 도전

박사학위 도전 6 (컴퓨터)

Potentilla 2022. 7. 26. 21:44

컴퓨터

 

20년 전과 크게 달라진 것 중의 또 하나가 컴퓨터의 활용이다. 석사 과정 중에는 컴퓨터는 단순히 식물 표본에 붙일 라벨지 출력, 논문 워딩 작업으로만 사용하였지만, 최근의 연구 방법론에서는 컴퓨터가 빠지면 연구를 진행할 수 없을 정도로 활용이 필수적으로 되었다. 식물 분류에서 컴퓨터를 이용해 통곗값을 구한다는 것을 어찌 상상이나 했겠는가! 초창기 식물사회학은 조사자의 주관적 관점에 완전히 의지하였기 때문에 너무 주관적이라는 비판을 받았다. 특정 숲을 잘 아는 능숙한 전문가가 방형구를 설치하고 동료들과 함께 식물 종을 조사하여 수기로 Relevé(레러바)라는 종이에 기록하였다. 이후 점차 조사 면적이 늘어나고 데이터양이 방대해지면서 수작업의 한계를 느끼게 되었는데, 마침 이때 컴퓨터가 등장하면서 다변량 분석이 가능해졌고 방대한 양의 데이터를 분석할 수 있게 되었다.

Gephi 0.9.2를 검색 엔진에 입력하고 다운받아 설치를 시도하였지만, 실행에 어려움이 겪어 이를 해결하는 데만 하루가 걸렸다. 최근 학문이라 Gephi를 사용하는 사람들이 많지 않기 때문에 엑셀이나 파워포인트처럼 사용 방법을 소개해놓은 책을 구하기도 어렵다. 결국 Google에서 Googling 하는 것으로 해결했다. 이후 프로그램 구동에서도 많은 문제점이 발생하였고, 이 또한 모두 구글링을 통해 세계 유저들의 도움으로 해결할 수 있었다. Gephi를 이용하기 위해서는 우선 조사된 데이터를 엑셀로 전처리해야 했기 때문에 엑셀을 다룰 줄 알아야 한다. 능숙능란까지는 아니지만, 어느 정도 엑셀을 활용할 수 있었기에 작업이 가능했다.

논문은 보통 10페이지에서 20페이지 정도로 요약되기 때문에 내용을 자세하게 설명해놓지 않는다. 그래서 막상 방법론을 따라 똑같이 해보려다가 막히는 부분이 많다는 것을 깨닫게 된다. 엑셀에 간단한 데이터를 입력하는 것부터 에러가 발생하여 Gephi에서 요구하는 폼을 완전히 이해하고 나서야 제대로 구동되었다. 하지만, 이러한 어려움은 시작에 불과했다. 정말 힘들게 했던 것은 방대한 데이터양과 엑셀 사용에 대해 미숙함이었다. 샘플을 이용한 작업에서는 쉽게 이루어지던 것이 데이터양이 늘어나면서 힘들게 되었다. 저널에 발표한 논문은 총 124개 조사구에서 총 93분류군이 출현하였다. 중복된 식물 종을 제외하여 총 93분류군이었고, 124개 조사구에서 평균 15종의 식물이 출현했다. 학위 논문에서는 1,255개 조사구에서 총 533분류군이 출현하였고, 조사구 당 평균 20종의 식물이 출현했다. 식물과 식물 사이에 긍정적인 상호작용을 하는지, 부정적인 상호작용을 하는지를 계산해야 해서 χ² 검정(카이제곱 검정)을 실시했다. χ² 검정은 명목척도의 통계 분석에 이용하며 한 종이 존재할 때 다른 종이 존재하지 않는지를 통계적으로 계산하는 것이다. 124개의 조사구에서 때죽나무가 있을 때 나머지 92분류군이 존재하는지를 세어서 계산 공식에 넣어 계산한다. 일일이 센다는 것은 거의 불가능하므로 엑셀을 이용하는데, 여기서 엑셀 활용 능력치에 따라 소요되는 시간이 달라지는 것이다. 엑셀 이용에 능숙하지 않아서 데이터를 분석하는 데만 4주가 소요되었다. 직장에서 일하는 시간 외에는 주말도 반납하고 계산에 매달렸다. 그렇다면 1,255개 조사구는? 말 그대로 끝없는 우주요, 암흑이다. 통계 프로그램 R을 이용하려고 해보았지만, R을 구입하는 것 자체가 어려웠다. 1년 사용 비용이 너무 비싸기 때문이다. 전일제로 대학원에 다녔다면 연구실 프로그램을 이용할 수 있었겠지만 파트로 공부한 나에게는 너무나 어려운 일이었다. 그래서 어쩔 수 없이 엑셀을 이용하였다. 저널에 투고한 논문은 순전히 노동의 대가로 이루어진 것이다. 박사학위를 준비하면서 한 달 동안 시간을 줄일 방법을 찾았다. 온라인 검색은 물론 엑셀에 일가견이 있는 주변 사람들에게 수소문했지만, 방법을 찾지 못했다. 결국 포기하지 않고 끝까지 노력하는 자가 승리한다고 했던가. 엑셀 매크로를 설명한 도서를 구입하여 공부한 후에 4개월이 걸릴 일을 3주로 줄이는 데 성공했다. 이래서 과학 기술이 발전하는가 보다. 어떻게든 좀 더 편하게, 효율적으로 일을 처리하고 싶은 마음 때문에.

이렇게 엑셀을 이용해 전처리했고, 이제 Gephi 활용이 남았다. 관련 한글 해설서가 없기 때문에 홈페이지에서 다운받은 메뉴얼을 따라 연습했다. 물론 한꺼번에 잘 되는 것을 바라지 않았다. 조작이 미숙한 탓에 자주 에러가 발생했지만 그래도 끝까지 노력하여 해결했다.

 

'작장인 박사 학위 도전' 카테고리의 다른 글

박사학위 도전 8 (해외 저널 투고)  (0) 2022.07.26
박사학위 도전 7 (통계학)  (0) 2022.07.26
박사학위 도전 5  (0) 2022.07.07
박사학위 도전 4  (0) 2022.07.07
박사학위 도전 3  (0) 2022.07.07