Обработка данных - ТОП 50 лучших книг
Практика студентов является составной частью основной образовательной программы высшего профессионального образования и представляет собой одну из форм организации учебного процесса, заключающуюся в профессионально-практической подготовке обучающихся, содействует закреплению теоретических знаний.
Изложены лекции по основам обработки сигналов и экспериментальных данных на ЭВМ, читавшиеся студентам четвёртого и пятого курсов факультетов молекулярной и химический физики, проблем физики и энергетики, физической и химической биологии МФТИ в 1995–2003 гг. В лекциях рассматриваются основные вопросы, существенные при обработке экспериментальных данных. Для большинства изложенных методов приводятся полные тексты компьютерных программ на Фортране-77 и Фортране-90 и примеры их использования, позволяющие читателям самостоятельно выполнять необходимые вычисления. Тексты этих программ, а также их исполняемые версии читатель может найти на сайте издательства «Физматлит» http://www.fml.ru. Для инженеров, аспирантов и студентов всех специальностей, прослушавших основные курсы математики в рамках университетской программы.
При работе любого enterprise-приложения образуются данные: это файлы логов, метрики, информация об активности пользователей, исходящие сообщения и т. п. Правильные манипуляции над всеми этими данными не менее важны, чем сами данные. Если вы – архитектор, разработчик или выпускающий инженер, желающий решать подобные проблемы, но пока не знакомы с Apache Kafka, то именно отсюда узнаете, как работать с этой свободной потоковой платформой, позволяющей обрабатывать очереди данных в реальном времени.
После покупки предоставляется дополнительная возможность скачать книгу в формате epub.
Практика студентов является составной частью основной образовательной программы высшего профессионального образования и представляет собой одну из форм организации учебного процесса, заключающуюся в профессионально-практической подготовке обучающихся, содействует закреплению теоретических знаний.
Описаны основные приемы программирования и конфигурирования компонент «1С:Предприятия» версии 7.7, как по отдельности, так и в различных сочетаниях. Приведены практические рекомендации по созданию констант, справочников, документов, перечислений, запросов и отчетов, меню и панелей инструментов, программных модулей на встроенном языке. Рассмотрена связь с внешними приложениями типа Microsoft Excel посредством OLE Automation. Основные приемы программирования и конфигурирования изложены с использованием сквозного примера. Каждое действие, описанное в книге, проиллюстрировано и сопровождается листингами процедур и функций.
Для программистов и пользователей системы «1С:Предприятие 7.7».
Книга посвящена изучению приемов и методов конструирования конфигурации в Конфигураторе «1С:Предприятие» с применением компонент, используемых при разработке конфигураций «Бухгалтерский учет», «Оперативный учет» и «Расчет». Для лучшего понимания логики конструирования приведена структура информационной базы всех трех компонент. Материал охватывает все стадии создания конфигурации: от постановки задачи до администрирования базы данных. Представлена структура метаданных, назначение метаданных иллюстрируется уникальными примерами разработки новой конфигурации «Коммунальные услуги». Также рассматриваются разнообразные отчеты, используемые при модифицировании уже существующих конфигураций. Описан механизм администрирования баз данных. Для создания элементарных процедур приведен синтаксис встроенного языка. Рассматриваются ошибки и сложности, которые могут возникнуть в процессе работы.
Для 1С-программистов и пользователей.
Учебно-методическое пособие содержит основные положения алгоритмизации и программирования, а также разработки структур баз данных в среде Microsoft Access. Рассмотрены вопросы, связанные с введением в программирование Visual Basic for Applications, который представляет собой унифицированный язык и среду программирования и разработки.
Для обучающихся по направлениям подготовки 09.03.01 Информатика и вычислительная техника; 09.03.02 Информационные системы и технологии; 15.03.04 Автоматизация технологических процессов и производств; 27.03.04 Управление в технических системах.
Приводимые в книге паттерны проектирования отражают лучшие практические подходы к решению типичных задач машинного обучения. Указанные паттерны, реализованные в программном коде, сконцентрировали опыт сотен экспертов в простые и легкодоступные советы. Книга содержит подробный разбор 30 паттернов, служащих для представления данных и задач, тренировки моделей, отказоустойчивого обслуживания, обеспечения воспроизводимости и искусственного интеллекта. Каждый паттерн включает в себя постановку задачи, ряд потенциальных решений и рекомендации по выбору технического приема, наилучшим образом подходящего к данной ситуации.
В руководстве изложены история создания теста Роршаха, этапы его развития и теоретические основы Интегративной системы психодиагностики методом Роршаха. Детально описаны все этапы процедуры исследования, техника кодирования и расчетов, алгоритмы и стратегии интерпретации полученных данных, адаптированные для русскоязычных пользователей. Технические приемы обработки и интерпретации результатов исследования демонстрируются на конкретных примерах. Приложения содержат все необходимые для проведения исследования рабочие таблицы. Подходы к оценке и интерпретации показателей методики Г. Роршаха трактуются с системных позиций, что позволяет на основе полученных данных построить модель функционирования личности испытуемого.
Руководство предназначено для психологов, врачей и всех специалистов, интересующихся психологической диагностикой, а также для студентов и аспирантов психологических и медицинских факультетов.
10. Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных
Человечество научилось собирать, обрабатывать и использовать в науке, бизнесе и повседневной жизни огромные массивы данных. Но что делать с данными, которых у нас нет? Допустимо ли игнорировать то, чего мы не замечаем?
Британский статистик Дэвид Хэнд считает, что это по меньшей мере недальновидно, а порой крайне опасно. В своей книге он выделяет 15 влияющих на наши решения и действия видов данных, которые остаются в тени. Например, речь идет об учете сигналов бедствия, которые могли бы подать жители бедных районов, если бы у них были смартфоны, о результатах медицинского исследования, которые намеренно утаили или случайно исказили, или о данных, ставших темными из-за плохого набора критериев для включения в выборку. Хэнд также рассказывает о том, какие меры могут сгладить эффект темных данных и как их можно обратить себе на пользу.
Книга посвящена ведению автоматизированного учета заработной платы на предприятиях, в организациях и учреждениях в программе "1С: Предприятие. Зарплата и Кадры". Излагаются принципы работы системы с учетом всех нормативных требований. Представлены сведения об автоматизированном формировании бухгалтерских проводок и аналитических отчетов широкого спектра, ведении первичной документации и многое другое. Обсуждаются схемы движения документов во всех разделах учета заработной платы, аспекты налогового учета и особенности ведения персонифицированного учета в новом плане счетов. Изложение материала сопровождается практическими примерами, позволяющими быстрее понять и усвоить приемы и методы работы с системой "1С: Предприятие". Рассматриваются ошибки и сложности, которые могут возникнуть при работе с программой. Книга открывает широкие возможности для дальнейшего самостоятельного изучения данной темы.
Для менеджеров, бухгалтеров и операторов, не имеющих опыта работы с системой "1С: Предприятие"
Электронная обработка данных становится доминирующей отраслью использования средств вычислительной техники наряду с микропроцессорным управлением технологическими, робототехническими и гибкими автоматизированными комплексами.
Понятие «информация», лежащее в основе электронной обработки данных и информационного моделирования в любой предметной области, является фундаментальным для разнообразных процессов управления в природе, технике и обществе.
Субъект хозяйствования может быть рассмотрен как совокупность управляющей подсистемы (подсистемы принятия решений) и управляемой производственно-технологической подсистемы.
При выработке оптимальных хозяйственных решений лица, принимающие решения, оперируют в своей повседневной деятельности массивами данных, составляющих информационный фонд компьютеризованных информационных систем и подсистем, реализуя порученные им информационно-управленческие задачи.
Информационное метамоделирование представляет собой моделирование специальными средствами информационных процессов…
Если вам необходима статистическая обработка данных для курсовой, диплома, статьи или диссертации; вы хотите лучше понимать результаты тех статистических методов, которые применяете; вы устали от того, что программы анализа данных не способны выполнить нестандартные задачи; вам необходимо перегруппировать ваши данные, но жаль тратить на это часы ручного труда; вам нужно освоить самые современные методы, еще не нашедшие отражения в большинстве статистических пакетов, то эта книга – для вас!
Изложение построено на базе самого современного программного обеспечения – статистической среды R, которая принадлежит к числу наиболее динамически развивающихся программ в своем классе.
Освоив R, вы сможете: полностью автоматизировать свою работу; запускать статистическую обработку прямо из текста документа; получать графики высокого качества и сохранить их в переносимых графических форматах; в любой момент повторить ваш анализ (например, если поменялись требования к иллюстрациям или исходные данные); использовать сотн…
Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. C помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala.
Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она рассказывает, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения.
В коллективной монографии изложены результаты многоаспектного анализа теории и практики эмпирических социальных и социологических исследований, проведенных в последние годы. Показаны новые тенденции и очерчена специфика проведения исследований – от крупномасштабных до более мелких, таких как фокус-группы, типологические группы, и отдельных случаев. Выяснены методологические и методические возможности ряда «качественных» методов сбора первичной информации (глубинное интервью, свободная беседа, интервью с фокус-группами, групповое обсуждение), а также охарактеризованы методы так называемой «горячей социологии»: «активное» исследование, этнометодология, биографический метод. Были запущены идеи использования нестатистических методов и решений при анализе данных эмпирических исследований. Выяснены суть и познавательный потенциал небольших выборок. Многочисленные методические решения представляют интерес не только для методологов-исследователей, но и для широкого круга читателей – социологов, студентов, препода…
В учебно-методическом пособии содержатся методические указания к практическим занятиям, даны рекомендации к выполнению самостоятельной работы, а также контрольные вопросы и задания по дисциплине «Информационное моделирование на этапе строительства».
Для обучающихся по направлению подготовки 08.04.01 Строительство.
Собрать разрозненные данные для отчета и представить их наглядно не самая простая задача для заказчика. Об этом хорошо знает Алексей Колоколов, который обучает анализу и визуализации данных с 2015 года. Он написал подробное руководство по созданию дашбордов и посвятил большую его часть практике. Колоколов последовательно разбирает процесс составления отчета, начиная с подготовки данных и заканчивая оформлением в фирменном стиле. На реальных примерах он описывает, что нужно сделать на каждом этапе, и сопровождает рассказ подробными иллюстрациями. Читатель сможет построить функциональный дашборд с нуля, даже не обладая навыками работы в Excel.
Я хочу, чтобы ваши отчеты были понятными и полезными. Чтобы данные в них говорили на языке бизнеса и помогали управленцам своевременно делать выводы. Для этого важно уметь превращать данные в информацию. Вот почему я написал эту книгу.
Алексей Колоколов объясняет, как предварительно поработать с данными, чтобы дашборд обновлялся автоматически, как расположить информац…
Настоящее пособие предназначено для изучения основных типов программных коллекций, хранящих множества данных, фундаментальных структур данных и алгоритмов управления ими. Также в пособии предлагается к применению технология проектирования и программирования коллекций, основывающаяся на объектно-ориентированном подходе в программировании.
Рассматриваются принципы и механизмы обработки данных и знаний в информационных системах.
Подробно описаны все этапы проектирования баз данных, требования к реляционным СУБД и перспективы их развития.
Учебно-методическое пособие предназначено для студентов высших учебных заведений, изучающих дисциплину «Введение в анализ больших информационных массивов», и содержит указания к выполнению пяти лабораторных работ для формирования у студентов навыков использования программного обеспечения и программных средств для структурирования больших массивов данных. Приведены краткие теоретические сведения, необходимые для выполнения лабораторных работ, контрольные вопросы и задания для подготовки к защите.
Python – идеальный выбор для манипулирования и извлечения информации из данных всех видов. «Python для data science» познакомит программистов с питоническим миром анализа данных. Вы научитесь писать код на Python, применяя самые современные методы, для получения, преобразования и анализа данных в управлении бизнесом, маркетинге и поддержке принятия решений.
Познакомьтесь с богатым набором встроенных структур данных Python для выполнения основных операций, а также о надежной экосистеме библиотек с открытым исходным кодом для data science, включая NumPy, pandas, scikit-learn, matplotlib и другие. Научитесь загружать данные в различных форматах, упорядочивать, группировать и агрегировать датасеты, а также создавать графики, карты и другие визуализации. На подробных примерах стройте реальные приложения, в том числе службу такси, использующую геолокацию, анализ корзины для определения товаров, которые обычно покупаются вместе, а также модель машинного обучения для прогнозирования цен на акции.
После покупки пр…
В последнее время взрывной рост числа датчиков, интернета и генерации огромных объемов данных предоставил новые возможности хранения, выполнения и реализации приложений на основе IoT и алгоритмов искусственного интеллекта. В учебном пособии рассмотрены такие основные темы по искусственному интеллекту, как краткая история развития искусственного интеллекта, понятия машинного обучения, классы решаемых задач, ансамблевые методы, глубокое обучение, метрики качества и другие базовые направления. Во второй части учебного пособия представлены примеры программы в интерактивной оболочке Jupyter Notebook на языке Python, реализующие алгоритмы искусственного интеллекта. В учебном пособии представлен программный код базовых задач искусственного интеллекта, таких как классификация, регрессия, нормализация и масштабирование данных, распознавание, прогнозирование и другие. Пособие также может быть полезно аспирантам, преподавателям вуза и специалистам, применяющим методы искусственного интеллекта в своей профессионально…
Практика студентов является составной частью основной образовательной программы высшего профессионального образования и представляет собой одну из форм организации учебного процесса, заключающуюся в профессионально-практической подготовке обучающихся, содействует закреплению теоретических знаний.
Учебник посвящен вопросам проектирования и разработки информационных систем. В нем рассматриваются современные методологии и технологии, применяемые при создании информационных систем, такие как RAD, CASE, COM, .NET, интернет-технологии, приводится подробное описание стандарта SQL-92 ANSI, излагаются теоретические сведения о реляционной модели данных, дается достаточно полное описание языков UML, SQL, HTML. В качестве инструментального средства разработки выбрана система объектно-ориентированного визуального программирования Delphi. В книге также рассмотрен ряд дополнительных вопросов: разработка справочной системы приложения, управление проектами приложений.
Допущено Министерством образования и науки Российской Федерации в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению подготовки дипломированных специалистов «Информатика и вычислительная техника».
Актуальность настоящего исследования обусловлена сложностью функционирования государственных информационных систем, все возрастающей необходимостью повышения достоверности представляемых в них данных, расширением спектра проверок, проводимых для обеспечения контроля на всех этапах прохождения данных. Проведение аналитического исследования применения различных параметров качества данных для государственных информационных систем позволило выявить предложения по контролю их качества. В данной статье автором выделены факторы, формирующие качество данных, и рассмотрены аспекты формализации связанных с ним процессов для государственных информационных систем. Даны рекомендации, которые возможно использовать в деятельности системных аналитиков, ИТ-специалистов по разработке сложных информационных систем.
Задачей автоматизации является получение оперативной, достоверной и непротиворечивой информации о деятельности предприятия, что позволяет оценить эффективность работы и в дальнейшем принимать обоснованные управленческие решения. Стандартные единые автоматизированные системы класса ERP не всегда являются наилучшим выбором, так как они часто требуют доработки и адаптации, что приводит к серьёзным затратам. Кроме того, они обладают избыточной функциональностью, что делает их недостаточно удобными, быстрыми и гибкими. В качестве платформы для построения автоматизированной системы бухгалтерского и налогового учёта было выбрано программное средство «1С: Предприятие» версии 7.7. Внедрение программы включало в себя её доработку. Возникшие при внедрении проблемы были успешно решены. В результате автоматизации доступна оперативная финансовая информация о деятельности предприятия, которая обладает достаточной полнотой.
Описывается подход на основе средств имитационного моделирования, позволяющий произвести оценку эффективности применения перспективной техники. Оценка производится на примере перспективного путеукладчика посредством статистического анализа данных, получаемых в ходе численных экспериментов с применением имитационного моделирования технологических процессов укладки верхнего строения пути.
Этот текст – сокращенная версия книги «Просто о больших данных» (Джудит Гурвиц, Алан Ньюджент, Ферн Халпер, Марсия Кауфман). Только самые ценные мысли, идеи, кейсы, примеры.
Посты в социальных сетях, данные навигаторов, датчики на производстве, показания приборов – ежедневно мир генерирует колоссальные объемы информации – Big Data, или большие данные. Пока основная часть больших данных никак не монетизирована. Но развитие технологий на стороне предприимчивых. Саммари знакомит со стратегиями и инструментами, которые помогут повернуть бурный поток информации в нужное вашей компании русло и использовать возможности больших данных для повышения эффективности бизнеса.
Читать, чтобы:
• Понять ключевые принципы работы с большими данными.
• Узнать, как превратить огромные объемы данных в понятную и полезную информацию.
• Познакомиться с практическими инструментами работы с большими данными и оценить, как их можно использовать в своем бизнесе.
Об авторах
Джудит Гурвиц – президент, глава совета директоров и идеол…
Рассмотрены практические аспекты разработки приложений Microsoft Office 2007/2009 в Delphi.
Описаны общие подходы к программированию приложений MS Office. Даны программные методы реализации функций MS Excel, MS Word, MS Access и MS Outlook в среде Delphi. Приведены практические примеры создания приложений, в которых задействованы основные механизмы доступа к объектам пакета Microsoft Office 2007 с помощью библиотек типов и визуальных компонентов. Существенное внимание уделено программированию обмена данными с использованием технологий ADO и DataSnap. Описаны методы передачи данных таблиц MS Excel в базы данных MySQL и дана их практическая реализация в среде Delphi.
Для программистов.
R – это мощный язык для статистических вычислений и графики, который может справиться поистине с любой задачей в области обработки данных. Он работает во всех важных операционных системах и поддерживает тысячи специализированных модулей и утилит. Все это делает R замечательным средством для извлечения полезной информации из гор сырых данных.
«R в действии» – это руководство по обучению этому языку с особым вниманием к практическим задачам. В данной книге представлены полезные примеры статистической обработки данных и описаны изящные методы работы с запутанными и неполными данными, а также с данными, распределение которых отлично от нормального и с которыми трудно справиться обычными методами. Статистический анализ – это только одна сторона дела. Вы также овладеете обширными графическими возможностями для визуального исследования и представления данных.
Учебно-методическое пособие включает материалы для подготовки к практическим занятиям и самостоятельной работе по теме «Методы и технологии обработки больших данных». Представлены возможности методов и технологий больших данных в задачах обработки информации, дан список вопросов для самоконтроля.
Для обучающихся по направлению подготовки 09.04.01 Информатика и вычислительная техника.
Сегодня наука о данных используется практически во всех сферах: вы видите подобранные специально для вас рекламные объявления, рекомендованные на основе ваших предпочтений фильмы и книги, ссылки на предполагаемых друзей в соцсетях, отфильтрованные письма в папке со спамом.
Книга знакомит с основами науки о данных. В ней охватываются все ключевые аспекты, начиная с истории развития сбора и анализа данных и заканчивая этическими проблемами, связанными с конфиденциальностью информации. Авторы объясняют, как работают нейронные сети и машинное обучение, приводят примеры анализа бизнес-проблем и того, как их можно решить, рассказывают о сферах, на которые наука о данных окажет наибольшее влияние в будущем.
«Наука о данных» уже переведена на японский, корейский и китайский языки.
Книга адресована специалистам по внедрению прикладных решений системы «1С:Предприятие 8», а также разработчикам, адаптирующим типовые прикладные решения к требованиям заказчика. Она рассказывает о новой технологии – расширениях конфигурации.
Расширения конфигурации позволяют дорабатывать функциональность прикладных решений, не внося изменений в сами прикладные решения.
В результате прикладное решение остается на полной поддержке поставщика, что значительно упрощает его дальнейшее сопровождение.
Также при работе в модели сервиса, например, в 1С:Фреш (1cfresh.com), расширения конфигурации позволяют дорабатывать функциональность прикладного решения только для пользователей одной организации. При этом другие
Книга описывает возможности расширений конфигурации, реализованные в платформе версии 8.3.13, в том числе расширение прикладных данных.
В первой и второй главах рассматривается общая архитектура расширений, и на большом количестве простых примеров показываются возможности доработки тех или иных элементов…
Учебник отвечает современным требованиям Федеральных государственных образовательных стандартов высшего образования по направлениям подготовки «Прикладнаяинформатика», «Бизнес-информатика», «Информационная безопасность». По каждой теме детально освещены теоретические и методические вопросы. Практическая часть обучения предполагает выполнение задач с использованием ПЭВМ. По основным темам дисциплины «Численные методы» представлены листинги программ некоторых алгоритмов, написанные на языке программирования высокого уровня C++ по технологии объектно-ориентированного программирования.
Учебник предназначен для студентов вузов очной и заочной форм обучения, изучающих курс «Численные методы».
В учебном пособии рассмотрены и определены теоретические основы современной геоинформатики, методы и алгоритмы переработки пространственных данных, архитектура прикладных компьютерных геоинформационных систем.
Цель пособия – дать общее представление о современном состоянии геоинформационных систем, средств, ресурсов и технологий, разнообразии разрабатываемых подходов к информатизации профессиональной деятельности на основе внедрения новых и традиционных геоинформационных технологий.
Предназначено для обучающихся по экономическим направлениям подготовки. Может быть полезным для специалистов в области информатики, телематики и картографии.
Предложен метод предварительной оценки прагматической ценности информации в задаче классификации состояния объекта на основе глубоких рекуррентных сетей долгой краткосрочной памяти. Цель проводимого исследования состояла в разработке метода прогноза состояния контролируемого объекта при минимизации количества используемых прогностических параметров, достигаемой с помощью предварительной оценки прагматической ценности информации. Это особенно актуальная задача в условиях обработки больших данных, характеризуемых не только значительными объемами поступающей информации, но и скоростью ее поступления и полиформатностью. Генерация больших данных сейчас происходит практически во всех сферах деятельности, что обусловлено широким внедрением в них Интернета вещей. Метод реализуется двухуровневой схемой обработки входной информации: на первом уровне применяется алгоритм машинного обучения «случайный лес», который имеет значительно меньшее количество настраиваемых параметров, чем рекуррентная нейронная сеть, использ…
Удостоенный премии Алана Тьюринга 2011 года по информатике, ученый и статистик показывает, как понимание причинно-следственных связей произвело революцию в науке и совершило прорыв в работе над искусственным интеллектом.
«Корреляция не является причинно-следственной связью» – эта мантра, скандируемая учеными более века, привела к условному запрету на разговоры о причинно-следственных связях. Сегодня это табу отменено. Причинная революция, открытая Джудией Перлом и его коллегами, пережила столетие путаницы и поставила каузальность – изучение причин и следствий – на твердую научную основу.
Работа Перла позволяет нам не только узнать, является ли одно причиной другого, она позволяет исследовать реальность, которая уже существует, и реальности, которые могли бы существовать. Она демонстрирует суть человеческой мысли и дает ключ к искусственному интеллекту.
В формате PDF A4 сохранен издательский макет книги.
Исчерпывающее исследование о причинах и следствии. Наконец-то можно разобраться что же появилось раньше, курица или яйцо?
Удостоенный премии Алана Тьюринга 2011 года по информатике, ученый и статистик показывает, как понимание причинно-следственных связей произвело революцию в науке и совершило прорыв в работе над искусственным интеллектом.
«Корреляция не является причинно-следственной связью» – эта мантра, скандируемая учеными более века, привела к условному запрету на разговоры о причинно-следственных связях. Сегодня это табу отменено. Причинная революция, открытая Джудией Перлом и его коллегами, пережила столетие путаницы и поставила каузальность – изучение причин и следствий – на твердую научную основу.
Работа Перла позволяет нам не только узнать, является
ли одно причиной другого, она позволяет исследовать реальность, которая уже существует, и реальности, которые могли бы существовать. Она демонстрирует суть человеческой мысли и дает ключ к искусственному интеллекту.
Эта книга содержит дополнительный…
В методических указаниях сформулированы требования к выполнению курсовой работы, рекомендации по оформлению, указаны критерии оценки, а также изложен процесс проектирования баз данных: от анализа предметной области до построения ER-диаграммы и запросов. Содержат в себе пример выполнения одного из вариантов курсовой работы.
Предназначены для студентов и преподавателей дисциплины «Управление данными».
Работа с неограниченными и быстрыми потоками данных всегда была сложной задачей. Но Kafka Streams и ksqlDB позволяют легко и просто создавать приложения потоковой обработки. Из книги специалисты по обработке данных узнают, как с помощью этих инструментов создавать масштабируемые приложения потоковой обработки, перемещающие, обогащающие и преобразующие большие объемы данных в режиме реального времени.
Митч Сеймур, инженер службы обработки данных в Mailchimp, объясняет важные понятия потоковой обработки на примере нескольких любопытных бизнес-задач. Он рассказывает о достоинствах Kafka Streams и ksqlDB, чтобы помочь вам выбрать наиболее подходящий инструмент для каждого уникального проекта потоковой обработки. Для разработчиков, не пишущих код на Java, особенно ценным будет материал, посвященный ksqlDB.
После покупки предоставляется дополнительная возможность скачать книгу в формате epub.
Перед вами – первая исходно русскоязычная книга, в которой на реальных примерах рассматриваются секреты обработки больших данных (Big Data) в облаках.
Основное внимание уделено решениям Microsoft Azure и AWS. Рассматриваются все этапы работы – получение данных, подготовленных для обработки в облаке, использование облачных хранилищ, облачных инструментов анализа данных.
Особое внимание уделено службам SAAS, продемонстрированы преимущества облачных технологий по сравнению с решениями, развернутыми на выделенных серверах или в виртуальных машинах.
Книга рассчитана на широкую аудиторию и послужит превосходным ресурсом для освоения Azure, Docker и других незаменимых технологий, без которых немыслим современный энтерпрайз.
Книга посвящена науке о данных (Data Science) и предназначена для широкого круга читателей, особенно она будет полезной для обучающихся по направлению подготовки «Интеллектуальные системы в гуманитарной сфере». Кратко описана история появления новой науки, даны основные понятия, связанные с хранением информации, Большими данными, системами счисления, научными парадигмами. Показаны этапы становления кибернетики и моделирования в гуманитарных науках, рассмотрены подходы к кибернетическому моделированию в медицине. Дана базовая информация о суперкомпьютере и квантовом компьютере. Сформулировано определение науки о данных, представлен прогноз ее развития в будущем.
Книга может служить учебным пособием для студентов высших учебных заведений и будет интересна обучающимся по разным техническим и гуманитарным направлениям подготовки. Также книга рекомендована аспирантам, молодым ученым, исследователям в области применения новых цифровых технологий, специалистам и руководителям организаций в рамках цифровой эконом…
В статье рассматривается разработанная и внедренная в НИУ МЭИ программная система, автоматизирующая подготовку текста проекта приказа, последующее его согласование и утверждение. Представлена специфика документооборота приказов, затрудняющая использование типовых систем электронного документооборота, представленных на современном рынке. Описан функционал основных модулей системы, используемых для подготовки шаблонов приказов, маршрутов согласования и проектов приказов, позволяющих автоматически актуализировать данные в связанной информационной системе согласно тексту утверждаемого приказа.
Учебное пособие содержит описание алгоритмов сжатия данных без потерь, включающее классификацию этих алгоритмов, их обсуждение на концептуальном уровне и на уровне программной реализации, сравнительный анализ результатов их практического применения, рекомендации по выполнению курсового проекта по данной теме. Также обсуждаются смежные вопросы: особенности работы с двоичными данными, формирования заголовочной части сжатого файла, применение вспомогательных алгоритмов, повышающих эффективность сжатия, и объектно ориентированного подхода к реализации алгоритмов сжатия. Пособие предназначено для бакалавров направления «Программная инженерия».
Cегодня Big Data – это большой бизнес.
Нашей жизнью управляет информация, и извлечение выгоды из нее становится центральным моментом в работе современных организаций. Неважно, кто вы – деловой человек, работающий с аналитикой, начинающий программист или разработчик, «Теоретический минимум по Big Data» позволит не утонуть в бушующем океане современных технологий и разобраться в основах новой и стремительно развивающейся отрасли обработки больших данных.
Хотите узнать о больших данных и механизмах работы с ними? Каждому алгоритму посвящена отдельная глава, в которой не только объясняются основные принципы работы, но и даются примеры использования в реальных задачах. Большое количество иллюстраций и простые комментарии позволят легко разобраться в самых сложных аспектах Big Data.
В данной работе авторы представили основные методы математической статистики, предназначенные для обработки данных, полученных при исследовании биологических и медицинских закономерностей. Кроме того, даны основы терминологии, указаны алгоритмы при работе с качественными и количественными значениями, представлены варианты тестирования выборки на нормальность распределения. В книге содержится информация о вычисляемых показателях, определяющих характеристики надежности любого диагностического метода. В приложениях представлены таблицы с критическими значениями статистических критериев, описаны возможности компьютерных программ для статистического анализа и дан перечень англоязычных терминов и устоявшихся аббревиатур, знание которых облегчит работу исследователя с непростыми англоязычными программами для статистического анализа.
Книга предназначена для врачей, занимающихся научно-исследовательской работой, а также биологов и студентов медицинских вузов.
Представлены основы теории баз данных, методы и алгоритмы, применяемые при реализации систем управления базами данных, а также особенности этих методов и алгоритмов, реализованные в СУБД PostgreSQL.
Материал книги составляет основу для базового учебного курса и содержит краткий обзор требований и критериев оценки СУБД и баз данных, теоретическую реляционную модель данных, основные конструкции языка запросов SQL, организацию доступа к базе данных PostgreSQL, вопросы проектирования приложений и основные расширения, доступные в системе PostgreSQL.
Приводятся основные приемы и методы сбора, систематизации и обработки информации массовых явлений, процессов, множеств сведений. На примерах из практики горного производства иллюстрируется возможность использования классических вероятностных схем при статистическом анализе процессов горного производства, результатов массовых измерений, наблюдений, опробования и оценки качества минерального сырья.
Для студентов, обучающихся по направлению «Горное дело». Может быть полезно горным инженерам предприятий, академических институтов и проектных организаций.
Цель данного пособия – ознакомить студентов с понятийными и теоретическими основами относительно управления данными; помочь получить навыки и умения применения методов управления данными в практической работе.
Курс лекций содержит девять лекций по дисциплине «Управление данными», включающих в себя основы проектирования современных систем управления данными. Курс лекций охватывает все разделы учебного курса.
Данный лабораторный практикум предназначен для магистров направления подготовки 15.04.04 «Автоматизация технологических процессов и производств».
В книге изложены основные принципы синтеза многоструктурных бесплатформенных навигационных систем военного назначения с различным составом измерительного комплекса. Показана возможность использования методов оптимальной нелинейной фильтрации для оценки вектора состояния таких систем. Впервые предложен метод управления выбором структур оценивания навигационных переменных на основе использования нелинейных вероятностных критериев, обеспечивающих требуемую точность навигации. Для научных работников, инженеров и студентов старших курсов, занимающихся вопросами разработки алгоритмов обработки навигационной информации и проектирования информационно-измерительных систем. Издание осуществлено при поддержке Российского фонда фундаментальных исследований по проекту 08-08-07003