Auflistung nach Schlagwort "Data mining"
1 - 10 von 12
Treffer pro Seite
Sortieroptionen
- ZeitschriftenartikelAn Index-Inspired Algorithm for Anytime Classification on Evolving Data Streams(Datenbank-Spektrum: Vol. 12, No. 1, 2012) Kranen, Philipp; Assent, Ira; Seidl, ThomasDue to the ever growing presence of data streams there has been a considerable amount of research on stream data mining over the past years. Anytime algorithms are particularly well suited for stream mining, since they flexibly use all available time on streams of varying data rates, and are also shown to outperform traditional budget approaches on constant streams. In this article we present an index-inspired algorithm for Bayesian anytime classification on evolving data streams and show its performance on benchmark data sets.
- ZeitschriftenartikelClusteranalyse von Smart-Meter-Daten(Wirtschaftsinformatik: Vol. 54, No. 1, 2012) Flath, Christoph; Nicolay, David; Conte, Tobias; Dinther, Clemens; Filipova-Neumann, LiliaDie Einführung der Smart-Meter-Technologie stellt die Energiewirtschaft in Deutschland vor große Herausforderungen. Neben hohen Investitionen in die Zähler- und Kommunikationsinfrastruktur ist auch die Neugestaltung vieler Geschäftsprozesse erforderlich. Da die neu entstehenden Kosten nur begrenzt an Endkunden übertragbar sind, gilt es die Aufwendungen der Energiewirtschaft durch neue Dienste und verbesserte Prozesse auf Basis von Smart Metering zu kompensieren. So ist durch die Clusteranalyse der detaillierteren Verbrauchsdaten eine deutlich feinere Kundensegmentierung auf Basis des zeitlichen Verbrauchsverhaltens möglich. Im Rahmen eines Smart-Metering-Projektes bei einem regionalen Energieversorger wurde eine Clusteranalyse für die real vorliegenden Kundenverbrauchsdaten entwickelt und in eine Business-Intelligence-Umgebung integriert. In diesem Beitrag beschreiben und evaluieren wir dieses Artefakt im Sinne der Design Science. Wir gehen dabei insbesondere auf die Ergebnisse der Clusteranalyse von Realdaten und den möglichen Einsatz zur segmentspezifischen Tarifgestaltung ein.AbstractThe introduction of smart meter technology is a great challenge for the German energy industry. It requires not only large investments in the communication and metering infrastructure, but also a redesign of traditional business processes. The newly incurring costs cannot be fully passed on to the end customers. One option to counterbalance these expenses is to exploit the newly generated smart metering data for the creation of new services and improved processes. For instance, performing a cluster analysis of smart metering data focused on the customers’ time-based consumption behavior allows for a detailed customer segmentation. In the article we present a cluster analysis performed on real-world consumption data from a smart meter project conducted by a German regional utilities company. We show how to integrate a cluster analysis approach into a business intelligence environment and evaluate this artifact as defined by design science. We discuss the results of the cluster analysis and highlight options to apply them to segment-specific tariff design.
- ZeitschriftenartikelData Analysis of Delays in Airline Networks(Business & Information Systems Engineering: Vol. 58, No. 2, 2016) Ionescu, Lucian; Gwiggner, Claus; Kliewer, NataliaCost-optimized airline resource schedules often imply a lack of delay tolerance in case of unforeseen disruptions, e.g. late check-ins, technical defects or airport and airspace congestion. Therefore, the consideration of timeliness and robustness has become an important topic in robust resource scheduling and a wide range of sophisticated scheduling approaches has been developed in recent years. However, these approaches depend on assumptions made concerning delay occurrences. A better understanding of delay mechanisms may lead to a better trade-off between cost-efficiency and robustness and is therefore the purpose of this paper. We provide a data-driven detection of decision rules for daytime delay trends, depending on spatio-temporal attributes. The focus is on interpretable rules whose prediction accuracy is compared to random forests as a non-parametric, automated modeling approach. The obtained results give an insight into both the nature of primary delay occurrence and the methodical potential of delay prediction in the context of robust resource scheduling.
- ZeitschriftenartikelData Mining mit unsicheren Daten(HMD Praxis der Wirtschaftsinformatik: Vol. 55, No. 3, 2018) Kellner, Florian; Schröder, NadineIm Zeitalter von Big Data werden immense Informationsbestände aus unterschiedlichen Quellen gesammelt. Die Daten sind häufig unvollständig, unsicher und ungenau. Ein Beispiel hierfür ist das OpenStreetMap Projekt, bei dem Nutzer auf der ganzen Welt einmal mehr und einmal weniger „sauber“ bzw. vollständig Daten beisteuern. In diesem Beitrag wird gezeigt, ob sich diese Daten eignen um ein betriebswirtschaftliches Problem zu lösen. Ein konkretes Fallbeispiel verdeutlicht, wie gut Standortentscheidungen einer Fast Food Kette unter Anwendung fortgeschrittener datenanalytischer Verfahren, wie bspw. Künstlicher Neuronaler Netze, Entscheidungsbäume und Logit-Modelle, nachempfunden werden können. Als Grundlage dienen die Daten des OpenStreetMap Projekts. Im Konkreten geht es darum, potenzielle Filialstandorte hinsichtlich deren Güte mittels OpenStreetMap Daten zu klassifizieren und die prognostizierten Lokationen mit tatsächlichen Standortentscheidungen zu vergleichen. Dabei zeigt sich, dass die Daten des OpenStreetMap Projekts grundsätzlich für die Prognose von Standorten geeignet sind. Allerdings ist die Wahl des datenanalytischen Verfahrens von Bedeutung. Im vorliegenden Fall konnte mit Hilfe der Künstlichen Neuronalen Netze das beste Prognoseergebnis erzielt werden. In the age of big data, a huge amount of information is being collected from diverse sources. These data are often incomplete, uncertain, and imprecise. An excellent example is the OpenStreetMap project, where users across the whole world contribute data on a more or less precise and complete level. This article shows whether these data are suited to support management decisions. A real-world example illustrates the extent to which location decisions of a fast food restaurant chain may be reproduced by means of advanced data analytic techniques, such as neural networks, decision trees, and logit models. The data are retrieved form the OpenStreetMap project. The basic task deals with classifying potential locations of the fast food restaurant chain and comparing the predicted locations with the actual locations. We find that data based on the OpenStreetMap project are generally suited for forecasting locations. However, the choice of the data analytic technique is important. In the case under consideration, neural networks resulted in the best forecast.
- KonferenzbeitragThe DESQ Framework for Declarative and Scalable Frequent Sequence Mining(INFORMATIK 2019: 50 Jahre Gesellschaft für Informatik – Informatik für Gesellschaft, 2019) Beedkar, Kaustubh; Gemulla, Rainer; Renz-Wieland, AlexanderDESQ is a general-purpose framework for declarative and scalable frequent sequence mining. Applications express their specific sequence mining tasks using a simple yet powerful powerful pattern expression language, and DESQ’s computation engine automatically executes the mining task in an efficient and scalable way. In this paper, we give a brief overview of DESQ and its components.
- KonferenzbeitragA New Approach for Automated Feature Selection(INFORMATIK 2019: 50 Jahre Gesellschaft für Informatik – Informatik für Gesellschaft, 2019) Gocht, Andreas; Lehmann, Christoph; Schöne, Robert
- ZeitschriftenartikelNot-so-distant reading: A dynamic network approach to literature(it - Information Technology: Vol. 60, No. 1, 2018) Luczak-Roesch, Markus; Grener, Adam; Fenton, EmmaIn this article we report about our efforts to develop and evaluate computational support tools for literary studies. We present a novel method and tool that allows interactive visual analytics of character occurrences in Victorian novels, and has been handed to humanities scholars and students for work with a number of novels from different authors. Our user study reveals insights about Victorian novels that are valuable for scholars in the digital humanities field, and informs UI as well as UX designers about how these domain experts interact with tools that leverage network science.
- ZeitschriftenartikelRevolution in Health and Wellbeing(KI - Künstliche Intelligenz: Vol. 29, No. 2, 2015) Lőrincz, AndrásWe argue that recent technology developments hold great promises for health and wellbeing. In our view, recent advances of (1) smart tools and wearable sensors of diverse kinds, (2) data collection and data mining methods, (3) 3D visual recording and visual processing methods, (4) 3D models of the environment with robust physics engine, and last but not least, (5) new applications of human computing and crowdsourcing started the revolution. We are neither claiming nor excluding that human intelligence will be reached in some years from now, but make the above claim, which is both weaker and stronger. We believe that fast developments for health and wellbeing are the question of active collaboration between health and wellbeing experts and motivated engineers.
- ZeitschriftenartikelSocial Media-Analyse – Mehr als nur eine Wordcloud?(HMD Praxis der Wirtschaftsinformatik: Vol. 53, No. 3, 2016) Böck, Matthias; Köbler, Felix; Anderl, Eva; Le, LindaAnalysen von Social Media-Daten haben gerade in den letzten Jahren stark an Aufmerksamkeit unter Entscheidern in Unternehmen gewonnen und werden immer häufiger als Instrument zur Steuerung wesentlicher Unternehmensfunktionen, insbesondere der kundenorientierten Marktbearbeitung, eingesetzt. Die Frage, wie sich konkrete Handlungsempfehlungen und Maßnahmen in Entscheidungsprozesse miteinbeziehen lassen, bleibt dabei jedoch häufig ungelöst. Hinzu kommt ein stetiges Abwägen, zwischen vollautomatisierten Reports und einer aufwändigen, manuellen und kostenintensiven Detailauswertung.Der Artikel beschreibt anhand von konkreten, beispielhaften Anwendungen aktuelle Auswertungsverfahren, die sowohl auf einer deskriptiven Ebene, aber auch mit Methoden aus dem Data Mining gesammelte Daten aus den Plattformen Facebook und Twitter analysieren und verschiedene exemplarische Fragestellungen beantworten. Dies kann im einfachsten Fall eine Übersicht zu aktuell häufig diskutierten Themen sein, aber auch deutlich detaillierte und komplexere Sachverhalte, wie die mitschwingende Emotion, die Vernetzung der mit dem Inhalt interagierenden Nutzer oder Zusammenhänge zwischen einzelnen Themen, umfassen.Um für ein Unternehmen und insbesondere für Entscheider einen Mehrwert zu schaffen, müssen die Analysen durch eine strategische Vorgehensweise geleitet sein sowie an Zielen ausgerichteter Fragestellungen und Ziel-Maßnahmen-Systeme Anwendung finden, um Erkenntnisse systematisch in konkrete Handlungsempfehlungen zu überführen. Abschließend diskutiert der Artikel mögliche Potentiale, die durch die Anwendung von komplexeren Analysemethoden entstehen, reflektiert aber auch konzeptionelle und technische sowie ethische Herausforderungen und Limitierungen.AbstractAnalyses of social media data have recently gained a lot of attention from decision makers in companies, and are used more and more as a steering instrument of essential business operations, especially the customer oriented marketing actions. However, the question how practical recommendations for actions and measures can be integrated in decision making processes, often remains unresolved. Additionally, there is a constant need to weigh up automatized reports against a time-consuming, manual and cost-intensive detail analysis.This article describe from concrete and exemplary applications, current analysis methods, which are analyzing data from the platforms Facebook and Twitter with both descriptive but also advanced data mining methods to answer to different, exemplary questions. This can be for the simplest case an overview of current frequently discussed topics, but also include considerably more detailed and complex issues, like emotions, the interconnectedness between users, who are interacting with a certain content, or the interdependencies between individual topics.Analyses have to be led by a strategic approach, as well as to be applied to objectives which orient on business questions and to objective measure systems to systematically translate insights into concrete recommended actions. This ensures to add value for companies and especially decision makers. The article concludes with possible potentials, which arise from the use of complex analysis methods, but also reflects conceptual and technical as well as ethical challenges and limitations.
- ZeitschriftenartikelÜberblick Analytics: Methoden und Potenziale(HMD Praxis der Wirtschaftsinformatik: Vol. 56, No. 5, 2019) Meier, AndreasDer Grundlagenbeitrag definiert und charakterisiert verschiedene Facetten des Analytics und zeigt auf, welche Nutzenpotenziale sich für die Wirtschaft ergeben. Nach der Klärung wichtiger Begriffe wird der Prozess zum Schürfen nach wertvollen Informationen und Mustern (Data Mining) in den Datenbeständen diskutiert. Danach werden wichtige Methoden des Data Mining wie des Soft Computing vorgestellt. Die Anwendungsgebiete des Web Analytics und Web Controlling dienen dazu, bedeutende Nutzenpotenziale beim Auswerten der digitalen Wertschöpfungskette elektronischer Geschäfte herauszuarbeiten. Ein Ausblick in die unbewusste Business Intelligence rundet den Beitrag ab. The basic contribution defines and characterizes various facets of analytics and shows the potential benefits for the economy. Once important terms have been clarified, the process of prospecting for valuable information and patterns (data mining) in databases is discussed. Afterwards, important methods for data mining as well as for soft computing will be presented. The application areas of Web Analytics and Web Controlling serve to identify significant potential benefits in evaluating the digital value chain of electronic business. An outlook into the unconscious Business Intelligence will complete the contribution.