본문 바로가기
반응형

분류 전체보기517

중국 AI 스타트업 딥 시크(DeepSeek)란 무엇일까? (미국 AI 업계 위기?) 중국의 AI 스타트업 딥 시크가 미국의 AI 시장에 미치는 영향에 대한 심도 있는 분석을 제공합니다. 저비용으로 미국의 거대 기업들과 견줄 만한 성능을 발휘하는 딥 시크의 출현은 미국 사회에 큰 긴장감을 주고 있습니다. 특히 딥 시크는 오픈 소스 모델을 통해 누구나 사용 가능한 AI를 제공함으로써 개발자들 사이에서 큰 주목을 받고 있습니다. 이러한 경쟁 속에서 미국의 막대한 투자 비용이 정당화되는지에 대한 의문이 제기되고 있습니다. 이 영상은 미국과 중국 간의 AI 패권 경쟁에서의 새로운 국면을 이해하는 데 큰 도움이 될 것입니다.[1]핵심 용어딥 시크: 중국의 AI 스타트업으로, 저비용으로 높은 성능을 가진 AI 모델을 개발하고 있습니다. 이 회사는 오픈 소스 모델을 제공하여 개발자들이 자유롭게 사용할.. 2025. 1. 28.
생성형 인공지능이란? 생성형인공지능정의 : 텍스트, 오디오, 이미지 또는 동영상 형태의 새로운 컨텐츠를 생성하도록 설계된 인공 지능 모델특징 : 사람과 유사한 반응을 생성하는 가상 비서를 설계하고, 동적으로 진화하는 컨텐츠가 포함된 비디오 게임을 개발하며, 특히 실제 데이터를 수집하는 것이 어렵거나 비현실적인 시나리오에서 다른 AI 모델을 학습하기 위한 합성 데이터를 생성하는 데 유용하게 사용생성형 AI가 적용되는 일반적인 워크플로데이터 수집: 생성할 컨텐츠 유형에 대한 예시가 포함된 대규모 데이터 세트를 수집합니다. 예를 들어, 사실적인 그림을 생성하기 위한 이미지 데이터 세트나 일관된 문장을 생성하기 위한 텍스트 데이터 세트가 수집됩니다.모델 훈련: 생성 AI 모델은 신경망을 사용하여 구축됩니다. 모델은 수집된 데이터 세.. 2025. 1. 27.
한성노트북 TFX3150U Pro (SSD 500GB) 사운드 안나올때 해결방법! 상황 : 한성노트북 TFX3150U Pro에 해당되는 드라이버 등을 모두 설치해도, 이상하게 사운드가 안나온다. 노트북에 스피커가 없는 것인가?라고 생각하던 찰나 해결방안을 찾고 다음과 같이 공유한다 사운드 드라이버 다운받기먼저 사운드 드라이버를 다운로드받자. 1~4단계가 귀찮다면 하단 드라이버 압축파일 다운! (2022년 이후 업데이트가 안된터라 압축파일 다운받아도 될 것 같다)  1. 한성 컴퓨터 고객센터 사이트 접속 : https://www.superstore.co.kr/customer_center/list.html?cc_menu=tbl_cc_download2. TFX3150U를 검색한 뒤, 첫 번째 게시글을 선택 3. 해당 게시글의 7번 째에 있는 오디오 드라이버를 다운로드 받는다4. 오디오 드라.. 2025. 1. 27.
SPSS / SAS란 무엇일까? SPSS, SAS는 통계 분석을 위한 소프트웨어다. 결론부터 말하자면 프로그래밍을 할 줄 모른다면 SPSS 프로그래밍을 할 줄 안다면 SAS. SPSS와 SAS의 대략적인 차이점은 다음과 같다 SPSS SAS 유료 통계 분석 소프트웨어 유료 통계 분석 소프트웨어 (고가) 통계 분석 방법이 메뉴로 구현되어 프로그래밍이 필요 없음 (초보가 사용하기 좋음) 다양한 기능, 결과에 대한 높은 신뢰도 - 공공기관, 연구소 등에서 구입 및 사용 자료 핸들링이 제한적. - 새 변수 생성 어려움 - 다수 자료 이용 분석시 어려움 프로그래밍 언어를 공부해야 함 명령문으로 프로그래밍은 가능하나 SAS, R에 비해 제한적 대용량의 데이터를 자유자재로 핸들링, 분석 수행 가능 정리. 대용량의 데이터를 다루는 통계 분석 SW를 .. 2022. 2. 13.
국내외 데이터 사이트 국내 사이트 서울열린데이터광장 https://data.seoul.go.kr/ 공공데이터포털 https://www.data.go.kr e-나라지표 http://www.index.go.kr/ 국가통계포털 http://kosis.kr 서울특별시 빅데이터 캠퍼스 https://bigdata.seoul.go.kr/ 통계청 http://kostat.go.kr/ 각 사이트를 보면, 여러 분야의 데이터를 다운로드 받을 수 있습니다. 혹은 원하는 데이터를 신청하면 제공해주기도 합니다. 그 외에도 데이터를 제공하는 여러 해외 사이트들이 있습니다. 해외 사이트 구글 데이터 검색 https://toolbox.google.com/datasetsearch 캐글 https://www.kaggle.com/datasets Awesom.. 2021. 9. 23.
3-11. DataFrame 이론 | 인덱스, 칼럼명 설정하기 position이란 칼럼의 앞 글자를 대문자로 수정해보자 하지만 위처럼 바꾸면 실제 df에 반영이 되지 않는다. 하단 처럼 작성해야한다. 첫번째 칼럼에는 이름이 없다. 여기에 Player Name을 부여하자 인덱스를 Player Name이 아니라 Number로 해주고 싶다면? +. 이렇게만 작성하면 DF에 반영이 안됨. inplace=True를 넣어줘야됨 🚫 여기서 주의할 점! 위 처럼 작성하면 기존의 선수이름이 삭제된다. 고로 기존의 인덱스를 새 컬럼에 지정해줘야 한다. 즉, 인덱스 -> 컬럼 으로 옮겨야한다. 이제 인덱스를 NUmber 칼럼으로 바꿔보자 💥💥💥 퀴즈 : 서류 전형 합격 여부' 조건 1. 각 파트가 최소 250점, 총 점수가 최소 600점이 되어야 서류 전형을 합격 2. “합격 여부”라.. 2021. 9. 10.
3-10. DataFrame 이론 | Row, Column 값 추가, 삭제 기존 데이터프레임 값 추가하기 아이폰XR 정보도 추가하려면? 다음처럼 정보 수정하듯이 작성하면 된다. 제조사라는 칼럼을 새로만들어서 모두 apple이란 값을 넣어보자. 값 삭제하기 기존의 DF를 건드리지 않고 아이폰XR 삭제하기. (row값 삭제하기) 기존 DF에서 아이폰XR 삭제하기 아이폰7, 아이폰8, 아이폰X 삭제하기 (여러 행 삭제하기) 문제 : 잘못된 데이터프레임 고치기1 ID 1의 무게를 200으로 변경하세요. ID 21의 row를 삭제하세요. ID 20의 row를 추가하세요. ID 20의 키는 70, 무게는 200입니다. 정답 코드 import pandas as pd df = pd.read_csv('data/body_imperial1.csv', index_col=0) # 코드를 작성하세요. .. 2021. 9. 10.
3-9. DataFrame 이론 | Row, Column 값 변경하기 하나의 Ro,w Column 변경하기 주어진 DataFrame 1. 아이폰8의 메모리를 바꿔보자. (특정 행,열을 지정하여 수정) 2. 아이폰8의 전체 정보를 바꿔보자 (1개의 행 전체 정보 변경) 행이기 때문에 loc를 사용한다. 3. ''디스플레이'' 칼럼 정보를 바꿔보자. (칼럼 1개 전체를 변경하자) 4. Face ID칼럼의 값을 전부 'Yes'로 바꿔보자. (만약 칼럼을 동일한 값으로 변경하고자 한다면?) 값을 하나만 넣으면 된다. 여러 Row를 한번에 변경하기 5. 디스플레이, Face ID칼럼을 x로 변경하기. (여러 칼럼을 한번에 변경하기) 6. 아이폰7, 아이폰X를 전부 o로 변경하기. (여러 행을 한번에 변경하기) 7. 디스플레이가 5보다 큰 것들만 인덱싱해보기 인덱싱 후 값 변경 il.. 2021. 9. 10.
3-8. DataFrame 이론 | DafaFrame Indexing 정리 이름으로 인덱싱하기 기본 형태 단축 형태 하나의 row 이름 df.loc["row4"] row 이름의 리스트 df.loc[["row4", "row5", "row3"]] row 이름의 리스트 슬라이싱 df.loc["row2":"row5"] df["row2":"row5"] 하나의 column 이름 df.loc[:, "col1"] df["col1"] column 이름의 리스트 df.loc[:, ["col4", "col6", "col3"]] df[["col4", "col6", "col3"]] column 이름의 리스트 슬라이싱 df.loc[:, "col2":"col5"] 위치로 인덱싱하기 기본 형태 단축 형태 하나의 row 위치 df.iloc[8] row 위치의 리스트 df.iloc[[4, 5, 3]] row .. 2021. 9. 10.
3-7. DataFrame 이론 및 실전 | 위치로 인덱싱(iloc) 정수위치로 인덱싱하기 : iloc (integer location) 주어진 DafaFrame iloc 적용하기 (모든 숫자는 인덱스의 번호를 상징) 1. 인덱스 2번째 행, 4번째 열을 출력해보자. 2. 1,3번 row의 1,4번 column을 출력해보자. 3. 연속된 인덱싱하기 2021. 9. 10.
3-6. DataFrame 이론 및 실전 | 연속 행▪열 출력, boolean, 조건 필터링 indexing import pandas as pd df = pd.read_csv('data/iphone.csv', index_col=0) iPhone X, iPhone 8 정보 가져오기. (행 2개 가져오기) 1차원은 Series 2차원은 DataFrame 연속된 row를 출력해보자 iPhone X까지 출력하기 df.loc[:'iPhone X'] 연속된 column(메모리 칼럼 ~ Face ID 칼럼)을 출력해보자. df.loc[ : , '메모리' : 'Face ID' ] Boolean 0,2,3,5 칼럼만 출력하기 df.loc=[[True, False, True, True, False, True , False]] 전체 칼럼에 대해 Boolean값을 작성하지 않았다면? 작성하지 않은 칼럼들에 대해선 F.. 2021. 9. 10.
3-5. DataFrame 이론 및 실전 | indexing, 칼럼 출력, 2개 파일 통합 indexing import pandas as pd df = pd.read_csv('data/iphone.csv', index_col=0) 특정 row, column 출력하기 행을 출력하려면 loc를 사용한다. 행과 열을 출력할때도 loc를 사용 열만 출력할 때는 loc없어도 됨. (단, 연속된 column을 출력할 때는 loc 사용) iphone 8(행)의 메모리(열)를 출력해보자 df.loc['iPhone 8','메모리'] # 행, 열을 지정 iPhone X의 전체 행을 출력해보자 df.loc['iPhone 8'] # 행 인덱스 네임만 입력 '출시일'을 출력해보자. (1가지 칼럼만 출력하기) df.loc[ : , '출시일'] # 칼럼 네임만 입력 df['출시일'] 출시일, 메모리를 출력해보자. (2가.. 2021. 9. 10.
3-4. DataFrame 실전 | DataFrame으로 파일 출력하기 Q1 ) DF변환하여 출력하기 조사 결과가 data 폴더의 popular_baby_names.csv라는 파일에 담겨 있는데요. 안에 있는 정보를 DataFrame으로 읽어 들이고, DataFrame을 출력 import pandas as pd df = pd.read_csv('data/popular_baby_names.csv') df Q2 ) 칼럼을 행의 제목으로 사용하기 data폴더의 mega_millions.csv 파일의 데이터를 DataFrame에 넣어 봅시다. 0번째 칼럼이 DataFrame의 인덱스가 되도록 해 주세요! import pandas as pd df = pd.read_csv('data/mega_millions.csv', index_col = 0) df 2021. 9. 10.
3-3. DataFrame 이론 | pandas의 데이터 타입 pandas DataFrame에는 다양한 종류의 데이터를 담을 수 있습니다. dtypes를 사용해서 각 column이 어떤 데이터 타입을 보관하는지 확인할 수 있는데요. import pandas as pd two_dimensional_list = [['dongwook', 50, 86], ['sineui', 89, 31], ['ikjoong', 68, 91], ['yoonsoo', 88, 75]] my_df = pd.DataFrame(two_dimensional_list, columns=['name', 'english_score', 'math_score'], index=['a', 'b', 'c', 'd']) print(my_df.dtypes) ### name object english_score int64.. 2021. 9. 9.
ubuntu 16.04 네트워크 문제 : 현재 네트워크는 .local 도메인을 가지고 있어 Avahi 네트워크 서비스 탐색에 문제를 일으킬 수 있습니다. 서비스를 사용하지 않습니다. 증상 : 우분투 실행시 "현재 네트워크는 .local 도메인을 가지고 있어 Avahi 네트워크 서비스 탐색에 문제를 일으킬 수 있습니다. 서비스를 사용하지 않습니다." 라는 팝업창 발생 팝업창을 없애는 방법 2가지 1. DNS를 1.1.1.1로 변경2. avahi-demon 을 수정 방법1 : DNS를 1.1.1.1로 변경 방법2 : avahi-demon 다음과 같이 수정 순서 : 1. CMD(터미널)창에 gedit /etc/default/avahi-daemon 입력 (root 로 로그인하지 않았다면, 앞에 su 를 붙여 주세요 - su gedit /etc/default/avahi-daemon) AVAHI_DAEMON_DETECT_LOCAL=1 을 AVAHI_DAEMON_DETECT_LOCAL=0 으로 .. 2021. 9. 9.
[AI 응용 ML] 이론 | 7.1 이미지 처리, 딥러닝, 자연어 처리 이미지 처리를 위한 데이터 전 처리 우리 주변의 이미지 처리 기술 예시 이미지 전 처리하기 모두 같은 크기를 갖는 이미지로 통일 1) 가로 세로 픽셀 사이즈를 표현하는 해상도 통일 2) 색을 표현하는 방식 통일 (RGB, HSV, Gray-scale, Binary, …) 이미지 처리를 위한 딥러닝 모델 기존 다층 퍼셉트론 기반 신경망의 이미지 처리 방식 합성곱 신경망(Convolution Neural Network) 작은 필터를 순환시키는 방식 이미지의 패턴이 아닌 특징을 중점으로 인식 합성곱 신경망의 구조 입력 이미지의 특징을 추출, 분류하는 과정으로 동작 이미지에서 어떠한 특징이 있는 지를 구하는 과정 필터가 이미지를 이동하며 새로운 이미지 (피쳐맵)를 생성 피쳐맵의 크기 변형 : Padding, S.. 2021. 9. 7.
[AI 응용 ML] 이론 | 3.3 RSS, MSE, MAE, 𝑹^𝟐 (결정 계수) 좋은 회귀 알고리즘 모델 평가하는 방법 목표를 얼마나 잘 달성했는지 정도를 평가해야 함 실제 값과 모델이 예측하는 값의 차이에 기반한 평가 방법 사용 예시 𝑅𝑆𝑆, 𝑀𝑆𝐸, 𝑀𝐴𝐸, 𝑀𝐴𝑃𝐸, 𝑅 2 RSS – 단순 오차 1. 실제 값과 예측 값의 단순 오차 제곱 합 2. 값이 작을수록 모델의 성능이 높음 3. 전체 데이터에 대한 실제 값과 예측하는 값의 오차 제곱의 총합 RSS 특징 • 가장 간단한 평가 방법으로 직관적인 해석이 가능함 • 그러나 오차를 그대로 이용하기 때문에 입력 값의 크기에 의존적임 • 절대적인 값과 비교가 불가능함 MSE, MAE – 절대적인 크기에 의존한 지표 MSE(Mean Squared Error) 평균 제곱 오차, RSS 에서 데이터 수 만큼 나눈 값작을수록 모델의 성능이 .. 2021. 9. 6.
[AI 응용 ML] 이론 | 3.2 다중선형회귀, Loss함수, 경사하강법 문제 만약, 입력값 𝑋에 강수량이 추가된다면? 즉, 평균 기온과 평균 강수량에 따른 아이스크림 판매량을 예측하고자 할 때 다중 선형 회귀를 사용하는 경우 입력값 𝑋가 여러 개(2개 이상)인 경우 활용할 수 있는 회귀 알고리즘 다중 선형 회귀 모델의 Loss 함수 단순 선형 회귀와 마찬가지로 Loss 함수는 입력값과 실제값 차이의 제곱의 합으로 정의 다중 선형 회귀 모델의 경사 하강법 다중 선형 회귀의 Loss함수 값이 작아지게 계속 업데이트 하는 방법 다중 선형 회귀 특징 • 여러 개의 입력값과 결괏값 간의 관계 확인 가능 • 어떤 입력값이 결괏값에 어떠한 영향을 미치는지 알 수 있음 • 여러 개의 입력값 사이 간의 상관 관계*가 높을 경우 결과에 대한 신뢰성을 잃을 가능성이 있음 상관 관계 • 두 가지.. 2021. 9. 6.
반응형