2015년 4월 24일 금요일

[00090] 과학계산 용도로서의 파이썬 장단점과 무료 라이브러리들

 파이썬에 대해서 웹서핑을 하다가 파이썬으로 과학 계산을 하는 분야에 대한 좋은 발표 형식의 글이 있어서 번역해 보았다. 단순히 파이썬을 쉽고 배우기 쉬운 범용 프로그래밍 언어라고만 알고 있다면 흥미로운 주제글일 것이다.(원문)

 과학 계산에 사용되는 툴(소프트웨어)와 작업 흐름. 왜 파이썬인가?

1. 과학자(공학자도 포함)의 요구

  • (모의실험, 실제 실험 제어에서 얻어진) 데이터 취득
  • 데이터의 조작, 가공
  • (작업 결과의 이해를 돕기 위한) 시각화
  • 보고서, 출판, 발표물 제작등의 의사소통 결과물들

2, 조금 더 구체적인 요구사항들 (역자 주: 원필자가 다분히 파이썬을 의식하고 나열한 것 같음.)


  • 고전적인 수치 해석 방법이나 기본적인 기능에 대한 풍부한 라이브러리: 그래프를 그리거나 푸리에변환이나 보간법 알고리듬 같은 것을 다시 직접 짤 필요가 없다. 바퀴를 다시 발명할 필요가 없듯이.
  • 배우기 쉬워야 한다 : 전산이나 컴퓨터 과학을 전공하지 않은 사람이라도 몇 분안에 그래프를 그리거나 신호를 필터링하거나 푸리에 변환 결과를 볼 수 있어야 한다.
  • 동 료, 학생, 고객와 의사소통이 쉬워야 한다. 즉 범용성이 확보되어야 한다. (역자 주:내가 작성한 코드를 그들도 알고 있거나 단기간에 배워서 쓸 수 있어야 한다.) 프로그래밍 언어 자체가 가능하면 적은 문법 기호와 불필요한 루틴을 가지지 말아야 한다. 그래서 코드를 읽어나가는데 수학적/과학적인 부분에 집중할 수 있어야 한다.
  • 신속하게 실행 가능해야 하며 기왕이면 고속으로 동작해야 한다. (...)
  • 가능하다면 거의 모든 경우에 있어서 단일 환경/단일 언어를 사용해야 한다. 문제가 달라질 때 새로운 언어나 툴을 다시 익혀야 한다면 곤란한다.

현존하는 해결책들 (프로그램들) : 과학자들은 어떤 툴로 작업하는가?


1. 컴파일러 언어: C, C++, Fortran, 등등
  • 장점
    • 컴파일러가 최적화되어 있으며 매우 빠르다. 계산량이 매우 많을 때 이러한 언어들의 성능을 능가하는 대안이 없음.
    • 고도로 최적화된 과학 라이브러리 (역자 주:주로 행렬연산 등 수치해석에 사용되는) 가 존재함. 예를 들어서 BLAS 등
  • 단점
    • 사용하기 매우 어렵다. (역자 주: 이게 가장 큰 장애물임. C/C++를 웬만큼 안다고 해도 이러한 라이브러를 익숙하게 사용하기는 어려움) 특히나 전산 전공이 아닌 사람들에게는 이러한 언어들로는 답이 없음.
 
2. 상용 스크립팅 언어 : 매트랩(Matlab), 매쓰매티카(mathematica), 매이플(maple) 등
  • 장점
    • 다양한 영역의 수많은 알고리듬을 구현한 풍부한 라이브러리. 보통 이런 라이브러리는 컴파일되어 있기 때문에 실행속도도 빠르다.
    • 잘 갖춰진 개발환경 : 잘 정리된 도움말, 편리한 IDE 등등
    • 상업적인 지원이 가능함.
  • 단점
    • 기본적인 언어가 다소 부실하다.(역자 주: 문법 자체가 잘 정돈되어 있지 않음에도 불구하고 하위 호환서을 유지하기 위해서 개선이 되지 않고 있음.)
    • 비싸다. (역자 주: 가장 큰 단점임. 특히 학생들에게)

3. 대안 스크립팅 언어들 : Scilab, Octave, R, Igor, IDL, etc.

  • 장점
    • 오픈소스, 대부분 무료이거나 matlab보다는 저가임.(역자주: Igor와 IDL이 상용프로그램임. Igor는 그래픽 성능이 뛰어나며 IDL은 천문학과 의학 영상 분야에서 많이 사용된다고 함.)
    • 어떤 기능은 매우 특화되어 있음 : 예를 들어서 R의 통계분석, Igor의 그래프 기능 등. (역자 주 : Scilab은 제어분야와 수치해석에, Octave는 matlab과 거의 유사한 문법을 가지는 특징이 있다.)
  • 단점
  • matlab 보다는 (당연히) 라이브러리가 빈약함. 사용되는 언어 자체도 크게 발전적이지 않음.
  • 어 떤 소프트웨어는 한 분야에만 사용 가능함 : 예를 들어서 gnuplot 이나 xmgrace 는 매우 강력한 기능을 가졌지만 그래프 기능으로만 한정되어 있다. (역자 주: 많은 오픈소스 수치 해석 프로그램이 gnuplot 을 채용하지만 scilab은 matlab과 유사한 독자적인 그래프 기능을 가지고 있다.)

4. 파이썬(python)의 경우는 어떠한가?

  • 일반적인 특성
    • 파이썬은 일반적이고 현대적인 컴퓨팅 언어.
    • 표준 라이브러리 모듈
    • 파이썬으로 작성된 많은 수의 특화된 모듈이나 어플리케이션 : 웹 분야 등등 그리고 과학 계산 분야
    • 개발 도구들 (자동 시험, 문서 생성기)Python language: data types (string, int), flow control, data collections (lists, dictionaries), patterns, etc.
  • 장점
    • (matlab보다는 부족하지만) 매우 풍부한 과학 계산 라이브러리들
    • 잘 고안된 언어, 가독성이 뛰어나고 구조화가 잘 되어 있어서 "생각한 대로 코딩"할 수 있다.
    • 과학 계산 이외 영역에도 다양한 라이브러리가 있다. : 웹서버 관리, 시리얼포트 접근 등등
    • 무료이고 오픈소스 언어이다. 광범위하게 사용되고 활발한 사용자그룹들이 있다.
  • 단점
    • (matlab에 비하면) 다소 불편한 개발 환경.
    • 좀 더 세분화된 전문 영역에서는 필요한 알고리듬이 없을 수도 있다.

과학 계산에 사용되는 파이썬의 라이브러리들(building blocks)


 matlab, scilab, R 등과 달리 파이썬은 과학 계산 전용으로 미리 묶여진 모듈들이 없다.(역자 주 : 현재는  python(x,y) 나 winPython 등 과학계산 전용 패키지가 배포되고 있음. )  아래에 과학 계산에 사용되는 기본적인 모듈(라이브러리)을 나열하였다.


댓글 없음:

댓글 쓰기