본문 바로가기

대학원 공부/programming language79

Numpy & Pandas : DataFrame 객체 -> Sqlite3 DB에 저장 Data 입력 형태 : Dict or list, tuple import pandas as pd raw_data = {'col0': [1, 2, 3, 4], 'col1': [10, 20, 30, 40], 'col2':[100, 200, 300, 400]} df = DataFrame(raw_data) print(display(df)) """ Out[5]: col0 col1 col2 0 1 10 100 1 2 20 200 2 3 30 300 3 4 40 400 """ 위의 방법은 딕셔너리 형태를 저장!!! 딕셔너리 형태로 저장한다면, columns을 중심으로 저장하게 된다. import pandas as pd raw_data = [[1, 10, 100], [2, 20, 200], [3, 30, 300], [4.. 2019. 11. 11.
Python : basic : import OS (파일, 디렉토리 조작) https://godoftyping.wordpress.com/2017/07/01/python-%ED%8C%8C%EC%9D%BC-%EB%94%94%EB%A0%89%ED%84%B0%EB%A6%AC-%EC%A1%B0%EC%9E%91/ [python] 파일, 디렉터리 조작 디렉터리, 파일, 확장자 분리 (get directory and file, extension) 파일 확인 (check file exists) 파일 복사 (copying files) 파일 이동 (moving files) 파일삭제 (deleting files) 디렉터리 복사 (copying directories) 디렉터리 이동 (moving directo… godoftyping.wordpress.com 디렉토리, 파일 확장자 분리 path.dir.. 2019. 11. 11.
Python : basic : 정규표현식 문장속에서 명확한 기준없이 (예를 들어 띄어쓰기라던지) 한글, 영어,숫자등이 섞여서 나올때가 있다. 이때 언어별 처리가 필요한 경우 regex라는 라이브러리를 사용할수 있다. 1. regex 설치 (맥기준, 우분투에서는 apt-get install python-regex 설치) # sudo pip install regex 2. 파이선 실행 # python 3. regex import >>> import regex 4. 한글, 영어, 한문을 모두 뽑아낸다. 숫자는 버린다 >>> regex.findall(ur'[\p{Hangul}|\p{Latin}|\p{Han}]+', u'24.resin수지樹脂') 결과) [u'resin\uc218\uc9c0\u6a39\u8102'] 5. 영문만 뽑아낸다. 나머지는 버린다... 2019. 11. 7.
Java : Overidding vs Overloading 전부터 헷갈리던 개념, Overriding, Overloading에 대해 포스팅! 특히 이 개념들은 class를 주로 다루는, python, C++, Java에서 사용하니 알아두면 좋다. Overloading Overloading 이란, 과적하다, 과부하라는 의미로! "" 같은 클래스내에서 같은 이름의 메서드를 사용하는 것"" 으로 클래스 메소드의 이름 수를 줄이는 대신, 여러 기능을 넣을 때 사용!! -> 매개변수의 타입을 다르게 하거나, 매개변수의 개수를 다르게 해 여러 기능을 가능하게 함. 따로 적어주지 않아도, 위에 2가지 중 하나만 만족을 한 상태에서 그냥 메소드 이름을 같게만 해줘도 Overloading 이 된다. Overriding Overridding 이란 가장 우선시되는, 최우선되는, 다.. 2019. 11. 3.
Java : public, private, default, protected https://mainia.tistory.com/5574 자바(Java) public, private, protected, default 접근 제어자 차이점은 자바(Java) public, private, protected, default 접근 제어자 차이점은 환경: Eclipse Mars 자바에는 변수와 함수, 클래스에 대한 접근을 제한하는 문법이 있습니다. 접근을 제한하는 이유는 객체가 가진 고유의.. mainia.tistory.com 여기 참고하기! 2019. 10. 31.
Java : wordcount 코드 정리 및 class들 정리 Class Text Text Class는 UTF-8 encoding을 이용하여 text를 저장한다. 이는 serialize, deserialize 하는 method를 제공하고, text들을 byte level 단위에서 비교한다. 또한 byte array를 string으로 바꿈 없이 string으로 바로 바꿔주는 method를 제공한다. 또한 encoded string의 길이를 계산한다. import java.io.IOException; // String을 Token 단위로 나눈다. import java.util.StringTokenizer; // configuration, path import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.. 2019. 10. 31.
Numpy : array_made Numpy는 Array를 다루는 라이브러리로 보통 Pandas와 같이 쓴다. numpy를 잘 이해하고, 잘 다룰줄 알아야 나중에 머신러닝 & 딥러닝에서 유용하게 쓰인다. 잘 알아두기!!!! import numpy as np # 1,2차원 생성 x = np.array([1,2,3,4]) y = np.array([[2,3,4],[1,2,5]]) print(x,y) print(type(x)) """ output: [1 2 3 4] [[2 3 4] [1 2 5]] """ ----------------------------------------- # np.arrange 함수로 생성하기 # 0-9까지 print(np.arange(10)) # 1-9까지 print(np.arange(1,10)) # np.arange(.. 2019. 10. 26.