Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
Tags
- koNLPy
- 데이터프레임
- 이상치
- value_counts
- 전처리
- 누락값
- MSE
- 결측치
- DataFrame
- 파이썬
- SimpleImputer
- BDA
- 결측치대체
- sklearn
- 대치법
- 보간법
- interpolate
- Seaborn
- Outlier
- matplotlib
- KoNLP
- stopwords
- join
- Python
- IterativeImputer
- countplot
- 불용어
- 선형보간
- Boxplot
- subplots
Archives
- Today
- Total
ACAIT
[BDA 데분기] 12주차 필수 과제 1 - 문자열 관련 함수 총 정리 본문


1. split()
- 문자열 나누는 함수. 구분자, 원하는 값으로 나누기.
- n: 구분자 기준으로 몇 번 나눌지.
- expand = True: 여러 컬럼으로 나누기.
- expand = False: 1개 컬럼에 나누기.


2. capitalize()
- 첫 문자를 대문자로 변환.

3. lower()
- 전부 소문자로 변환.

4. upper()
- 전부 대문자로 변환.

5. center(width, fillchar = )
- 문자열 너비 지정 후 문자열 가운데 정렬하고 양쪽에 문자 채움.

6. count(char)
- 특정 문자 갯수 반환.

7. find(패턴, start, end), findall()
- 문자열 내에서 인자로 받은 문자열, 패턴을 찾아 인덱스를 반환하는 함수.
- 기존 문자열의 시작, 끝 인덱스로 찾을 범위를 지정할 수 있음.
- -1.0은 해당 내용이 없다는 의미.
- findall은 해당되는 문자를 리스트로 반환.

8. format(*args, **kargs)
- 문자열 출력 시 f" {} 코드와 같은 역할.
- print(f" {num} ")
- 변수에 문자열 선언할 때, 문자열의 {} 부분에 format 값이 채워져 반환.
- format 내부에서 변수명 선언하지 않으면 인덱스로 출력.

9. index(패턴), index(패턴, start, end)
- find는 찾지 못했을 때 -1을 반환, index는 에러가 발생.

10. isdigit()
- 문자열이 숫자만으로 이루어졌는지 확인.

11. isalpha()
- 문자열이 알파벳으로만 이루어졌는지 확인.

12. isspace()
- 문자열이 공백인지 확인.

13. isupper(), islower()
- 문자열이 대문자, 소문자로만 이루어졌는지 확인.

14. partition(char)
- 특정 문자로 문자열 분할.

15. replace(old, new)
- 기존 문자를 새로운 문자로 변환.

16. rfind(char)
- 문자열 오른쪽부터 탐색하고 인덱스 반환.

17. rsplit(char, 구분 횟수)
- 오른쪽부터 문자열 분할.

18. strip(string)
- 기존 문자열 양쪽에서 인자로 전달받은 문자열 제거.
- 문자열 입력하지 않으면 양쪽 공백 제거.

19. rstrip(string), lstrip(string)
- 기존 문자열의 왼쪽, 오른쪽에서 인자로 전달받은 문자열 제거.

20. zfill(width)
- 지정한 너비가 되도록 문자열 앞에 0을 채움.

21. rjust(width, char), ljust(width, char)
- rjust 오른쪽 정렬, ljust 왼쪽 정렬 후 문자로 너비 채움.


22. join(string)
- 문자열 리스트 사이를 다른 문자열로 연결.
- 채울 문자열.join(기존 문자열)

23. pad(width, side = , fillchar = )
- 문자열의 길이 맞추거나, 0 패딩 맞출 때 사용하는 문법.
- rjust, ljust과 동일한 결과 반환.

24. slice(start, stop)
- 특정 인덱스 값의 결과만 반환.
- start: 제거할 문자열 시작 인덱스.
- stop: 제거할 문자열 마지막 인덱스.

25. slice_replace(start, stop, repl)
- 특정 인덱스 값을 다른 문자로 대체.
- repl 인자 입력 안 하면 특정 인덱스 값 잘라내고 나머지만 반환.
- start: 제거할 문자열 시작 인덱스.
- stop: 제거할 문자열 마지막 인덱스.

26. len()
- 문자열 길이 반환 함수.


27. swapcase()
- 소문자는 대문자로, 대문자는 소문자로 변환.

28. title()
- 단위별 앞 문자를 대문자로 변환.

'학회 활동 > BDA 7기(데이터 분석 기초반)' 카테고리의 다른 글
| [BDA 데분기] 13주차 - 텍스트 전처리, 토큰화, 태깅 (1) | 2024.02.01 |
|---|---|
| [BDA 데분기] 12주차 필수 과제 2 - 영화 리뷰 분석 (0) | 2024.02.01 |
| [BDA 데분기] 12주차 - 문자열 관련 함수 (0) | 2024.01.31 |
| [BDA 데분기] 11주차 - 데이터 전처리 (1) | 2024.01.31 |
| [BDA 데분기] 10주차 - kaggle master 코드 분석 (1) | 2024.01.31 |